Presto là gì

Samira Kabbour

CMO

115 bài viết

Mục lục

1. Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

1.1. Vậy thì Presto là gì?

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Không phải bởi vì Presto hiểu SQL, đồng thời nó có những tính năng của những dạng cơ sở dữ liệu tiêu chuẩn để rồi nhận định nó là một dạng cơ sở dữ liệu quan hệ. Nó không thay thế được dạng cơ sở dữ liệu như MySQL, PostgreSQL, hay Oracle. Presto không được thiết kế để xử lý những giao dịch trực tuyến (Online Transaction Processing-OLTP). Điều này cũng đồng thời đúng với các dịch vụ Dataware House.

Vậy thì Presto là gì?

Presto là công cụ sinh ra nhằm giải quyết vấn đề truy vấn một lượng lớn dữ liệu bằng các câu truy vấn phân tán (distributed query)

Tại sao lại cần truy vấn phân tán:

Trong trường hợp bạn cần làm việc với hàng petabyte, terabyte dữ liệu, có lẽ là bạn sử dụng công cụ này để tương tác với Hadoop, hay là hệ thống file bên dưới của nó là HDFS.

Presto thiết kế để truy vấn HDFS sử dụng kỹ thuật đường ống ( pipeline) đối với các Job của MapReduce như là Hive, Pig, thế nhưng khác với Hive, Pig … Presto không chỉ giới hạn chỉ HDFS. Presto có thể được mở rộng để hoạt động với các nguồn dữ liệu khác bao gồm cơ sở dữ liệu truyền thống, hay Cassandra

Mục đích ra đời của Presto

Nhằm xử lý truy vấn đối với Data Warehouse (kho chứa dữ liệu – Cấu trúc) và Phân tích (analytic): Phân tích dữ liệu, gộp (aggregate) khối lượng lớn của dữ liệu để trích xuất báo cáo từ đó. Dạng công việc này gọi là Phân Tích Dữ Liệu Trực Tuyến (Online Analytical Processing-OLAP)

Nếu bạn có câu hỏi hoặc đang thiết kế Data Warehouse hay cần một chiến lược về Datalake, xin vui lòng gửi thông tin về info@renovacloud.com để được tư vấn thêm

(Tạm hết phần 1)

KHÔNG CHỈ LÀ LỜI NÓI SUÔNG

CÁC TIN TỨC KHÁC

Hướng dẫn xây dựng chatbot RAG hỗ trợ AI với Amazon Lex, Bedrock và S3

Doanh nghiệp ngày càng cần trợ lý AI trả lời đúng, nhanh và bám sát dữ liệu nội bộ – chatbot RAG đang trở thành hướng triển khai thực tế hơn so với chatbot chỉ dựa vào kiến thức sẵn có của mô hình. Bài viết này hướng dẫn cách xây dựng chatbot RAG hỗ […]

16 phút

Hướng dẫn triển khai PoC GenAI trên AWS nhanh, chính xác

Doanh nghiệp bạn muốn thử nghiệm GenAI để ra quyết định nhanh hơn nhưng lại ngại rủi ro về thời gian, chi phí và độ chính xác – một PoC (Proof of Concept) được triển khai đúng cách trên AWS sẽ giúp kiểm chứng ý tưởng rõ ràng trước khi đầu tư lớn. Bài viết […]

42 phút

Tư vấn Amazon Bedrock Việt Nam: Giải pháp Generative AI đột phá cho doanh nghiệp

Trong kỷ nguyên Generative AI (GenAI), việc lựa chọn một nền tảng mạnh mẽ và an toàn để xây dựng ứng dụng là yếu tố sống còn của doanh nghiệp. Amazon Bedrock nổi lên như một lựa chọn hàng đầu, cho phép các tổ chức tiếp cận và tùy chỉnh các mô hình nền tảng […]

14 phút

Presto là gì

Samira Kabbour

Mục lục

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Vậy thì Presto là gì?

Hướng dẫn xây dựng chatbot RAG hỗ trợ AI với Amazon Lex, Bedrock và S3

Hướng dẫn triển khai PoC GenAI trên AWS nhanh, chính xác

Tư vấn Amazon Bedrock Việt Nam: Giải pháp Generative AI đột phá cho doanh nghiệp

Điện Toán Đám Mây & Dịch Vụ Quản Lý

Chuyển đổi dữ liệu và AI

Bảo mật đám mây

Bảo mật đám mây

CÔNG NGHỆ

VỀ CHÚNG TÔI

CHUYỆN KHÁCH HÀNG

Bảo mật đám mây

Presto là gì

Samira Kabbour

Chia sẻ bài viết

Mục lục

Đầu tiên chúng ta phải làm rõ rằng: Presto không phải là một dạng database

Vậy thì Presto là gì?

Chia sẻ bài viết

KHÔNG CHỈ LÀ LỜI NÓI SUÔNG

CÁC TIN TỨC KHÁC

Hướng dẫn xây dựng chatbot RAG hỗ trợ AI với Amazon Lex, Bedrock và S3

Hướng dẫn triển khai PoC GenAI trên AWS nhanh, chính xác

Tư vấn Amazon Bedrock Việt Nam: Giải pháp Generative AI đột phá cho doanh nghiệp