Presto là gì

Samira Kabbour

CMO

115 bài viết

Mục lục

1. Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

1.1. Vậy thì Presto là gì?

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Không phải bởi vì Presto hiểu SQL, đồng thời nó có những tính năng của những dạng cơ sở dữ liệu tiêu chuẩn để rồi nhận định nó là một dạng cơ sở dữ liệu quan hệ. Nó không thay thế được dạng cơ sở dữ liệu như MySQL, PostgreSQL, hay Oracle. Presto không được thiết kế để xử lý những giao dịch trực tuyến (Online Transaction Processing-OLTP). Điều này cũng đồng thời đúng với các dịch vụ Dataware House.

Vậy thì Presto là gì?

Presto là công cụ sinh ra nhằm giải quyết vấn đề truy vấn một lượng lớn dữ liệu bằng các câu truy vấn phân tán (distributed query)

Tại sao lại cần truy vấn phân tán:

Trong trường hợp bạn cần làm việc với hàng petabyte, terabyte dữ liệu, có lẽ là bạn sử dụng công cụ này để tương tác với Hadoop, hay là hệ thống file bên dưới của nó là HDFS.

Presto thiết kế để truy vấn HDFS sử dụng kỹ thuật đường ống ( pipeline) đối với các Job của MapReduce như là Hive, Pig, thế nhưng khác với Hive, Pig … Presto không chỉ giới hạn chỉ HDFS. Presto có thể được mở rộng để hoạt động với các nguồn dữ liệu khác bao gồm cơ sở dữ liệu truyền thống, hay Cassandra

Mục đích ra đời của Presto

Nhằm xử lý truy vấn đối với Data Warehouse (kho chứa dữ liệu – Cấu trúc) và Phân tích (analytic): Phân tích dữ liệu, gộp (aggregate) khối lượng lớn của dữ liệu để trích xuất báo cáo từ đó. Dạng công việc này gọi là Phân Tích Dữ Liệu Trực Tuyến (Online Analytical Processing-OLAP)

Nếu bạn có câu hỏi hoặc đang thiết kế Data Warehouse hay cần một chiến lược về Datalake, xin vui lòng gửi thông tin về info@renovacloud.com để được tư vấn thêm

(Tạm hết phần 1)

KHÔNG CHỈ LÀ LỜI NÓI SUÔNG

CÁC TIN TỨC KHÁC

Dịch vụ migrate lên AWS tại Việt Nam – Renova Cloud

Cloud Migration đang trở thành hướng đi chiến lược giúp doanh nghiệp hiện đại hóa hạ tầng, tối ưu vận hành và tăng khả năng mở rộng trong giai đoạn chuyển đổi số. Tại Việt Nam, Amazon Web Services (AWS) được nhiều doanh nghiệp lựa chọn nhờ hệ sinh thái dịch vụ đa dạng, hiệu […]

20 phút

Hiện đại hóa ứng dụng trên AWS: Lộ trình 4 bước và case study thực tế tại Việt Nam

Nền kinh tế số tại Việt Nam đang chuyển mình mạnh mẽ, việc duy trì các hệ thống phần mềm cũ (legacy systems) là một rào cản kỹ thuật, thậm chí còn đe dọa đến sự phát triển bền vững của doanh nghiệp. Hiện đại hóa ứng dụng trên AWS (Amazon Web Services) giúp doanh […]

22 phút

Sơ đồ mô tả hệ thống Cloud OpEx sau khi migration lên AWS

Dịch vụ tư vấn FinOps AWS Việt Nam – Tối ưu chi phí cloud cho doanh nghiệp

Chi phí AWS thường tăng lên rất âm thầm. Một workload mới vừa triển khai, một database test bị bỏ quên, một EC2 chạy dư cấu hình hoặc một luồng data transfer tăng bất thường đều có thể khiến hóa đơn cloud cuối tháng “phình to”. Vấn đề nằm ở chỗ doanh nghiệp không phải […]

17 phút

Presto là gì

Samira Kabbour

Mục lục

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Vậy thì Presto là gì?

Dịch vụ migrate lên AWS tại Việt Nam – Renova Cloud

Hiện đại hóa ứng dụng trên AWS: Lộ trình 4 bước và case study thực tế tại Việt Nam

Dịch vụ tư vấn FinOps AWS Việt Nam – Tối ưu chi phí cloud cho doanh nghiệp

Điện Toán Đám Mây & Dịch Vụ Quản Lý

Chuyển đổi dữ liệu và AI

Bảo mật đám mây

Bảo mật đám mây

CÔNG NGHỆ

VỀ CHÚNG TÔI

CHUYỆN KHÁCH HÀNG

Bảo mật đám mây

Presto là gì

Samira Kabbour

Chia sẻ bài viết

Mục lục

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Vậy thì Presto là gì?

Chia sẻ bài viết

KHÔNG CHỈ LÀ LỜI NÓI SUÔNG

CÁC TIN TỨC KHÁC

Dịch vụ migrate lên AWS tại Việt Nam – Renova Cloud

Hiện đại hóa ứng dụng trên AWS: Lộ trình 4 bước và case study thực tế tại Việt Nam

Dịch vụ tư vấn FinOps AWS Việt Nam – Tối ưu chi phí cloud cho doanh nghiệp