So Sánh Dịch vụ học máy (ML) và trí tuệ nhân tạo(AI) của Amazon, Google, IBM và Microsoft trong điện toán đám mây
Samira Kabbour
CMO
Các dịch vụ đám mây: Học máy (ML) và trí tuệ nhân tạo (AI) của Amazon, Google, IBM và Microsoft. Dịch vụ học máy và trí tuệ nhân tạo đang trưởng thành nhanh chóng do sự bùng nổ được sử dụng trong kinh doanh. Bài viết dưới đây sẽ cung cấp cho các chuyên gia kỹ thuật và người đọc tổng thể về các tính năng, khả năng tích hợp và triển khai từ các nhà cung cấp dịch vụ đám mây lớn nhất hiện nay trên thế giới. Các dịch vụ đã cho thấy sự hỗ trợ trong việc triển khai các ứng dụng và dịch vụ dựa trên đám mây thông qua các API tương đối đơn giản được khai thác thành ba ngành chính của AI: học máy (Machine Leaning – ML), xử lý ngôn ngữ (Language Processing – LP) và khả năng thị giác máy tính (Computer vision capabilities – CV).
Chúng ta đang chứng kiến sự phát triển mạnh mẽ của các dịch vụ dựa trên trí tuệ nhân tạo (AI) từ các nhà cung cấp dịch vụ đám mây (CSP) 2019 do lộ trình chiến lược mạnh mẽ hơn và nhiều trường hợp sử dụng hơn.
Gartner định nghĩa trí tuệ nhân tạo là một công nghệ hoặc hệ thống có thể mô phỏng hoạt động của con người, điển hình là:
- Học tập
- Rút ra kết luận
- Xuất hiện để hiểu nội dung phức tạp
- Tham gia vào các cuộc đối thoại tự nhiên với mọi người
- Nâng cao hiệu suất nhận thức của con người
- Thay thế mọi người trong việc thực hiện các nhiệm vụ không theo thủ tục thường ngày
Các dịch vụ đám mây (CPS) được thảo luận trong tài liệu này là:
- Mục đích xây dựng
- Đa nhiệm
- Dùng bao nhiêu, trả bấy nhiêu
- Linh động
- Được gói trong các API nhẹ và / hoặc UI dễ sử dụng
Trong nhiều trường hợp, các nhóm có thể sử dụng các dịch vụ đám mây này để thực hiện phân tích nâng cao hoặc sử dụng AI mà không cần phát triển thuật toán hoặc khoa học dữ liệu. Các dịch vụ này giúp đơn giản hóa các nỗ lực trí tuệ nhân tạo (AI) bằng cách loại bỏ sự phức tạp của kiến trúc hệ thống ML và bằng cách cung cấp các hệ thống được xử lý trước phù hợp với các trường hợp sử dụng cụ thể. Trong hầu hết các dịch vụ trí tuệ nhân tạo AI, thuật toán tiền xử lý là một tài nguyên được chia sẻ, chúng đã được đào tạo tổng quát và rộng rãi dựa trên dữ liệu được thu thập bởi nhà cung cấp.
Hầu hết các dịch vụ trí tuệ nhân tạo (AI) từ các điện toán đám mây (CSP) được thảo luận trong tài liệu này thuộc một trong ba loại:
- Dịch vụ học máy đa năng
- Xử lý ngôn ngữ
- Tầm nhìn máy tính
Trong bài viết này, chúng tôi tập trung vào các dịch vụ dựa trên AI được cung cấp bởi bốn CSP hàng đầu: Amazon, Google, IBM và Microsoft.
Các ngành AI
AI được phân loại thành ba ngành chính: học máy, xử lý ngôn ngữ và thị giác máy tính. Kích thước tương đối của các vòng tròn thể hiện sự trưởng thành của việc vận dụng, các công cụ và công nghệ trong mỗi nghành tại thời điểm hiện tại.
Trong mỗi phân loại này, các dịch vụ đám mây (CSP) cung cấp một loạt các tính năng và khả năng dưới dạng các ứng dụng phát triển hoặc các mô hình được xử lý trước thông qua các dịch vụ API.
Dịch vụ học máy (ML)
Học máy(ML) là một nhánh của trí tuệ nhân tạo, nơi bạn có thể đào tạo các hệ thống máy tính để học từ dữ liệu. Các hệ thống có thể được đào tạo để cải thiện kinh nghiệm theo thời gian.
ML cũng là cơ sở để hỗ trợ triển khai hai lĩnh vực khác của dịch vụ AI trên cloud: xử lý ngôn ngữ và thị giác máy tính. Các mô hình xử lý trước được sử dụng trong các dịch vụ LP và CV được xây dựng bằng các thành phần vốn có hoặc nền tảng khoa học dữ liệu do CSP cung cấp.
Các dịch vụ ML được phân loại thành ML engine, nền tảng ML, máy gia tốc phần cứng ML và dịch vụ ML. Không giống như CV và LP, bao gồm các thuật toán cụ thể, được xử lý trước, các dịch vụ ML này cho phép các nhà phát triển, người thực hành dữ liệu và kiến trúc sư:
- Xây dựng mô hình của riêng họ
- Huấn luyện và đánh giá các mô hình đó bằng dữ liệu của riêng họ
- Triển khai / tích hợp các mô hình trong các hệ thống LP và CV.
Các dịch vụ này có thể thực hiện các loại phân tích ML phổ biến nhất, bao gồm phân loại, phân cụm và hồi quy.
Dịch vụ xử lý ngôn ngữ (NLP)
Xử lý ngôn ngữ (hoặc xử lý ngôn ngữ tự nhiên (NLP), như nó thường được nhắc đến) cung cấp một cách để chúng ta giao tiếp với các hệ thống thông minh bằng cách sử dụng ngôn ngữ của con người. Lĩnh vực NLP liên quan đến việc làm cho máy tính thực hiện các nhiệm vụ hữu ích với các từ tự nhiên được sử dụng bởi con người. Đầu vào và đầu ra của hệ thống NLP có thể là lời nói hoặc văn bản và hệ thống AI dựa trên NLP điển hình thường có cấu tạo bao gồm:
- Kênh kết nối chatbot của bạn với kênh bạn đang hỗ trợ
- Hiểu ngôn ngữ tự nhiên (NLU), quá trình ánh xạ dữ liệu đầu vào thành các sự biểu hiện được sử dụng để phân tích các khía cạnh khác nhau của ngôn ngữ
- Thành phần xử lý các yêu cầu của người dùng.
Trong một số trường hợp, tạo ngôn ngữ tự nhiên (NLG), giúp tạo ra các phản hồi tổng hợp và có ý nghĩa
Các dịch vụ xử lý ngôn ngữ được cung cấp bởi các dịch vụ đám mây thông qua API giúp phân tích ngôn ngữ của con người – bằng văn bản hoặc âm thanh. Trong hầu hết các trường hợp, các dịch vụ này cung cấp hỗ trợ cho một số ngôn ngữ. Ví dụ, một số dịch vụ phân tích và trích xuất lời nói từ bản ghi kỹ thuật số. Hay những ứng dụng cho phép đàm thoại, thông dịch một loạt các ngôn ngữ và xử lý văn bản thành giọng nói.
Dịch vụ thị giác máy tính
Thị giác máy tính được định nghĩa là một môn khoa học trích xuất thông tin từ hình ảnh hoặc video. Dữ liệu hình ảnh có thể có nhiều dạng, chẳng hạn như chuỗi video, hình ảnh từ nhiều camera hoặc dữ liệu đa chiều từ máy quét y tế. Thị giác máy tính tìm cách trích xuất dữ liệu chiều cao từ hình ảnh, từ đó mô phỏng các nhiệm vụ của hệ thống thị giác của con người.
Các dịch vụ thị giác máy tính cung cấp các API cho phép các hình ảnh hoặc video kỹ thuật số được chuyển sang thuật toán ML dịch vụ để phân tích. Mỗi dịch vụ được xây dựng có mục đích và tập trung vào một nhóm các trường hợp sử dụng duy nhất, ví dụ như:
- Việc triển khai trường hợp sử dụng nhận dạng ký tự quang học (OCR) có thể được thực hiện bằng thuật toán được đào tạo trên nhiều hình ảnh văn bản.
- Tương tự, một thuật toán có thể được đào tạo để thực hiện phân tích tình cảm của con người trên các khuôn mặt được phát hiện trong hình ảnh và được cung cấp dưới dạng dịch vụ API.
- Các thuật toán cụ thể có thể được đào tạo để phát hiện và lập danh mục khuôn mặt như một phần của nhận dạng hình ảnh / khuôn mặt.
Tóm tắt các dịch vụ AI
Phân tích
Các thuật toán tiền xử lý có thể thực hiện phát hiện đối tượng hoặc phát hiện bối cảnh một danh mục giữa hàng chục ngàn đối tượng đã được sàng lọc trước.
Trong tài liệu này, chúng tôi sẽ kiểm tra các dịch vụ được cung cấp bởi Amazon Web Services (AWS), Microsoft, Google và IBM qua ba ngành chính của AI: học máy, xử lý ngôn ngữ và thị giác máy tính.
Khi chọn dịch vụ đám mây ML, các nhóm nên xem xét chuyên môn và kinh nghiệm của họ với học máy, cùng với các mục tiêu của dự án của họ. Các tiêu chí sau được lấy từ phản hồi từ các khách hàng của Gartner.
Sự phát triển tiếp theo của giao diện người-máy tính đã thuộc về chúng ta. Amazon Alexa, Microsoft Cortana, Google Home và Apple Siri đã thể hiện sức mạnh của giao diện ngôn ngữ này và sự tích hợp của chúng với các ứng dụng điều khiển các thiết bị trong xe cộ và nhà thông minh.
Table below compares the availability of CV features from Amazon, Google, IBM and Microsoft cloud services.
Các dịch vụ AI từ các CSP được thảo luận trong tài liệu này thuộc một trong ba loại: học máy, xử lý ngôn ngữ hoặc thị giác máy tính. Ba dịch vụ học máy, xử lý ngôn ngữ hoặc thị giác máy tính này được minh họa trong hình dưới, cùng với các tham chiếu đến các dịch vụ cụ thể từ bốn nhà cung cấp. Mặc dù các dịch vụ AI này được cung cấp riêng dưới dạng các giải pháp độc lập từ nhiều nhà cung cấp, các doanh nghiệp thường thích làm việc với một nhà cung cấp AI duy nhất cho tất cả các dự án AI của họ. Điều này làm cho nhiệm vụ hiểu môi trường và phát triển mối quan hệ với nhà cung cấp đơn giản hơn. Khi các doanh nghiệp trở nên quen thuộc với cả các công nghệ và với các mục tiêu của riêng họ, họ có thể chọn chuyển sang một nhà cung cấp độc lập khác có thể đáp ứng tốt hơn các nhu cầu cụ thể
Trong tài liệu này, chúng tôi sẽ kiểm tra các dịch vụ được cung cấp bởi Amazon Web Services (AWS), Microsoft, Google và IBM qua ba ngành chính của AI: học máy, xử lý ngôn ngữ và thị giác máy tính.
Các dịch vụ học máy
Xử lý ngôn ngữ
Sự phát triển tiếp theo của giao diện người-máy tính đã thuộc về chúng ta. Amazon Alexa, Microsoft Cortana, Google Home và Apple Siri đã thể hiện sức mạnh của giao diện ngôn ngữ này và sự tích hợp của chúng với các ứng dụng điều khiển các thiết bị trong xe cộ và nhà thông minh.
Computer Vision
Bảng dưới đây so sánh CV features from Amazon, Google, IBM and Microsoft cloud
services
Tóm tắt các dịch vụ AI
Các dịch vụ AI từ các CSP được thảo luận trong tài liệu này thuộc một trong ba loại: học máy, xử lý ngôn ngữ hoặc thị giác máy tính. Ba dịch vụ học máy, xử lý ngôn ngữ hoặc thị giác máy tính này được minh họa trong hình dưới, cùng với các tham chiếu đến các dịch vụ cụ thể từ bốn nhà cung cấp. Mặc dù các dịch vụ AI này được cung cấp riêng dưới dạng các giải pháp độc lập từ nhiều nhà cung cấp, các doanh nghiệp thường thích làm việc với một nhà cung cấp AI duy nhất cho tất cả các dự án AI của họ. Điều này làm cho nhiệm vụ hiểu môi trường và phát triển mối quan hệ với nhà cung cấp đơn giản hơn. Khi các doanh nghiệp trở nên quen thuộc với cả các công nghệ và với các mục tiêu của riêng họ, họ có thể chọn chuyển sang một nhà cung cấp độc lập khác có thể đáp ứng tốt hơn các nhu cầu cụ thể.Trên đây là bốn dịch vụ liên quan đến dịch vụ đám mây. với những top 10 xu hướng cho chiến lược điện toán đám mây năm 2019, thì dịch vụ học máy, trí tuệ nhân tạo, dịch vụ xử lý ngôn ngữ, dịch vụ thị giác máy tính đóng vai trò lớn trong tương lai