Siri ngày càng sử dụng nhiều trí tuệ nhân tạo hơn để trở thành một trợ lý như người thật với khả năng hiểu vừa đủ về chủ nhân để đưa ra những lời thúc giục và nhắc nhở nhẹ nhàng vào đúng thời điểm trong suốt một ngày dài.

Về lý thuyết, trợ lý này càng học được nhiều về bạn, về thói quen, môi trường sống của bạn thì các trợ giúp nhỏ nhặt này càng trở nên ý nghĩa và hữu ích hơn.

Hầu hết các công ty công nhệ lớn hiện đang phát triển các trợ lý cá nhân theo nhiều dạng thức khác nhau. Để đào tạo các trợ lý này, nhiều công ty có xu hướng thu thập tối đa dữ liệu từ các thiết bị của bạn cũng như các dịch vụ đám mây mà bạn sử dụng. Sau đó họ sử dụng sức mạnh của điện toán đám mây và machine learning để tổng hợp cũng như phân tích dữ liệu đó. Điều này cho phép các công ty kết nối những thông tin về thói quen, dự định và sở thích của bạn. Những gì học được sau đó có thể được dùng để đưa ra các đề nghị trợ giúp hữu ích và sáng suốt. Chẳng hạn, biết được lịch sử ăn uống, địa điểm, thời gian trong ngày và các dữ liệu khác, một trợ lý ảo có thể đưa ra đề nghị về một địa điểm ăn pizza ngon mà không quá đông khách.

Tuy nhiên, khi cuộc chiến AI tại thung lũng Silicon đang ngày càng gay gắt, có ý kiến gần đây cho rằng những nỗ lực AI của Apple đã lạc hậu so với các công ty khác một phần bởi hãng này quan tâm đến việc bảo vệ dữ liệu người dùng.

Trong số các công ty công nghệ lớn, Apple luôn luôn tỏ ra khắt khe về vấn đề quyền riêng tư và cố gắng ngăn chặn việc thu thập dữ liệu người dùng mang tính cá nhân trong các máy chủ của hãng cũng như miễn cưỡng chấp nhận việc khai thác dữ liệu đóng vai trò quan trọng trong ngành công nghệ. Chính Apple đã lặp đi lặp lại, thậm chí trong các phiên tòa, rằng dữ liệu cá nhân của bạn nên được giữ riêng tư, không phải cảnh sát, nhà quảng cáo hay bất cứ ai trong hầu hết các trường hợp.

Với việc không gửi dữ liệu của người dùng lên trên mạng đám mây, Apple đang tự gây trở ngại cho tiềm năng của Siri, “bỏ đói” các mô hình AI cần đến các dữ liệu cá nhân cần thiết để hỗ trợ khả năng tùy biến và hỗ trợ thông tin cho người dùng.

Apple đã gần như im lặng về luận giải trên, nhưng một số thành viên đội ngũ AI và Siri của hãng gần đây đã cho biết quyền riêng tư của người dùng và AI thông minh không phải là các nguyên tắc cạnh tranh của Apple.

Cách mà Siri học và lượng dữ liệu cá nhân cần thiết để trợ lý này hoạt động có hiệu quả mới là điều mà Apple quan tâm nhất: Các cập nhật trong tương lai sẽ tạo cho Siri một vai trò ngày càng trung tâm trong các tương tác giữa chúng ta với tất cả sản phẩm của Apple.

AI ngay trên thiết bị

Cũng giống như các đối thủ, Apple thực hiện rất nhiều tác vụ xử lý và machine learning thú vị trên dữ liệu do người dùng cung cấp dưới dạng nói hoặc nhập liệu. Phần lớn các nhiệm vụ này, đặc biệt là liên quan đến thông tin cá nhân, đều được thực hiện trên thiết bị, ngoài người dùng ra thì không ai biết đến, dù là Apple hay bất kỳ một ai khác.

Khi bạn đưa ra một yêu cầu cho Siri, phần mềm iPhone của bạn không yêu cầu bất kỳ một thông tin gì liên quan đến ID người dùng mà sẽ đưa ra môt địa chỉ ID ngẫu nhiên. Sau đó phần mềm mã hóa câu lệnh và chuyển đến mạng đám mây để được nhận diện thêm giọng nói nhằm xác định các từ, sau đó trải qua một quá trình xử lý ngôn ngữ tự nhiên và hiểu được ý nghĩa của chúng.

Các chip đồ họa và các chip chuyên dụng khác chịu trách nhiệm xử lý công việc trong các thiết bị của Apple đều có sức mạnh tính toán và tốc độ ngày càng tăng.

Ưu thế của Apple chủ yếu là do công ty kiểm soát cả phần cứng và phần mềm liên quan đến các tính toán machine learning ngay trên thiết bị. Các kỹ sư của công ty đã dành nhiều thời gian tối ưu hóa phần mềm machine learning của họ giúp làm việc tốt hơn với các bộ xử lý và cảm biến trên thiết bị của khách hàng. Sự tương thích đó giúp cho điện thoại và tablet của Apple quản lý được khối lượng tính toán đáng kể của các chức năng như nhận dạng hình ảnh và phân tích ngôn ngữ tự nhiên. Có thông tin cho rằng Apple cũng đang phát triển một chip chuyên dụng để thực hiện tất cả các dạng tính toán trí tuệ nhân tạo.

Những gì được đưa lên mây

Apple đào tạo các mẫu AI trên mây, nhưng không phải bằng dữ liệu người dùng cụ thể. Chẳng hạn, Apple có thể sử dụng một hình ảnh đào tạo của bên thứ ba để dạy mô hình AI xác định một hình ảnh trong ứng dụng Photos là một cái cây, một cần câu hay con chim gõ kiến.

Phần quan trọng nhất của Siri là các mô hình nhận dạng giọng nói và ngôn ngữ ngữ tự nhiên của Apple, cho phép trợ lý ảo này hiểu những từ mà người dùng nói và ý nghĩa của chúng. Trong một số trường hợp, các nhóm kỹ sư sử dụng âm thanh của các yêu cầu bằng giọng nói của người dùng làm dữ liệu đào tạo, tất cả đều được ẩn danh.

Apple giữ lại bản ghi giọng nói của người dùng trong vòng 6 tháng để dạy cho công cụ nhận dạng giọng nói hiểu rõ hơn về người dùng. Có rất nhiều yêu cầu như vậy để lựa chọn. Siri hiện có 375 triệu người dùng mỗi tháng và có mặt tại 36 quốc gia với 21 ngôn ngữ. Apple thậm chí đã phát triển các mô hình chuyên giúp Siri hiểu được những lời nói của những người nói tiếng Anh như một ngôn ngữ thứ hai.

Sau 6 tháng, Apple lưu lại một bản ghi khác, nhưng không có ID người dùng, nhằm dùng cho việc cải tiến Siri. Những bản ghi âm này có thể được lưu giữ trong vòng 2 năm. Apple cho biết âm thanh của các yêu cầu về âm nhạc, các đội thể thao, người chơi, các doanh nghiệp hoặc các vấn đề quan tâm khác cũng được giữ lại để đào tạo Siri.

Nhờ quá trình đào tạo với dữ liệu ẩn danh đó, Siri có thể đề xuất cho bạn các ứng dụng, phát hiện các sự kiện trong tin nhắn và thêm chúng vào lịch làm việc, đưa các tin tức có liên quan dựa trên sở thích của bạn. Việc đào tạo diễn ra trên máy chủ của Apple, nhưng các mô hình chỉ bắt đầu thực hành những gì chúng học được khi được triển khai trên thiết bị của bạn.

Cụ thể, trên các cỗ máy của Apple, những mô hình này bắt đầu thực hiện các tính toán dựa trên những thứ bạn nhập hoặc chạm vào thiết bị, hoặc dựa trên những thứ chúng nhìn thấy qua camera, nghe qua micrô hoặc cảm nhận bằng bộ cảm biến của thiết bị. Theo thời gian, điều này tạo ra một lượng khổng lồ dữ liệu cá nhân trên thiết bị, với dung lượng tầm 200MB. Công việc của Siri là sử dụng dữ liệu đó để thu thập thông tin chi tiết về bạn, đem đến các hỗ trợ ngày càng hữu ích.

Dựa trên lòng tin khách hàng

Các đối thủ cạnh tranh của Apple như Google và Facebook có vẻ ngày càng trở nên sáng tạo và tích cực hơn trong việc tận dụng dữ liệu người dùng và điện toán đám mây để giúp cho các trợ lý ảo của họ ngày càng hữu ích hơn. Họ là các công ty quảng cáo cung cấp dịch vụ từ mạng đám mây, đương nhiên họ có cách tiếp cận thu thập và tận dụng dữ liệu người dùng rất khác nhau. Việc kinh doanh của họ phụ thuộc vào đó.

Apple đang ngày càng trở thành một công ty cung cấp dịch vụ đám mây. Hiện tại, chỉ riêng việc cung cấp Apple Music và iCloud đã chiếm đến 1/4 doanh thu của công ty. Bên cạnh đó, thị phần của họ trong lĩnh vực này cũng ngày một tăng lên. Tuy nhiên, Apple lại cho rằng họ vẫn là một công ty phần cứng với 2/3 doanh thu hoàn toàn đến từ việc bán ra các sản phẩm như iPhone.

Từ một góc nhìn chiến lược, Apple có quyền kiểm soát nền tảng phần cứng mà ở đó người dùng có thể trải nghiệm được thành quả cuối cùng do AI tạo ra. Bằng cách giữ lại nhiều mô hình machine learning cơ bản trên thiết bị chứa dữ liệu cá nhân của người dùng, công ty có thể duy trì vị thế là một người bảo vệ chặt chẽ về quyền riêng tư của dữ liệu đó. Điều này không chỉ là PR tốt mà còn là một chiến lược kinh doanh thông minh: Apple muốn bán cho bạn các thiết bị cá nhân, các công cụ tối ưu để tổ chức cuộc sống của bạn, và đó là một thiết bị bảo mật, tin cậy và an toàn nhất cho dữ liệu cá nhân và riêng tư của bạn.

Thực ra, phương pháp tiếp cận lấy thiết bị làm trung tâm của Apple cuối cùng có thể cho thấy tính ưu việt hơn so với các cách tiếp cận của các công ty khác trong việc học và phân tích sở thích cũng như hành vi của bạn. Bởi vì Apple đang giữ thông tin cá nhân trong phạm vi bảo vệ thiết bị của mình, bạn có thể cho rằng họ đang ở một vị trí tốt nhất để tìm hiểu thông tin đời tư của bạn theo cách mà các công ty khác không thể.

Cho dù thế nào, cuộc tranh luận về các chức năng của Siri (cũng như các năng lực AI của Apple) liên quan đến việc tôn trọng quyền riêng tư hầu như chỉ là vấn đề học thuật. Ít nhất hiện tại, không dễ dàng gì để chỉ một chức năng quan trọng mà Siri không thể thực hiện được do sự kiên quyết bảo vệ quyền riêng tư của Apple, hoặc do thiếu dữ liệu người dùng.

Vấn đề của Siri đơn thuần hơn như vậy. Trợ lý này không phải lúc nào cũng cung cấp câu trả lời chính xác và hợp lý như Google Assistant khi câu hỏi liên quan đến tìm kiếm trên mạng hoặc bản đồ. (Siri dựa vào công cụ tìm kiếm Bing của Microsoft và ứng dụng Maps của riêng mình). Các vấn đề khác xuất phát từ bức tường rào quá kín của Apple. Chẳng hạn như, Siri chỉ có thể trả lời yêu cầu nhạc bằng các bài hát từ Apple Music chứ không phải từ YouTube hoặc các dịch vụ của bên thứ ba như Spotify.

Trong khi ngược lại, Siri thường tỏ ra được việc hơn khi cung cấp trợ giúp và câu trả lời cá nhân hóa cho người dùng. Trợ lý này có thể gợi ý một chủ đề Tin tức mới sau khi để ý thấy bạn đã đọc rất nhiều blog về một chủ đề cụ thể nào đó. Nó có thể nhận ra rằng bạn thường luyện tập vào sáng thứ Ba và Năm tại một khung thời gian, sau đó bắt đầu đề xuất bạn tập luyện vào những thời điểm đó.

Một hướng tư duy mới

Siri đã ra đời từ năm 2011 nhưng Apple chỉ mới thực hiện việc “cấy não” đáng kể cho trợ lý này cách đây 2 năm.

Quá trình biến đổi đó diễn ra theo 2 phần. Thứ nhất, sau nhiều năm dựa trên công cụ nhận dạng giọng nói của Nuance để hiểu người dùng nói gì với Siri, Apple quyết định bắt đầu phát triển các công cụ ngôn ngữ tự nhiên và nhận diện giọng của riêng mình.

Bước tiến này cùng với sự chuyển dịch lớn hơn đối với cách thức hoạt động của bộ não Siri, nhắm đến các mạng thần kinh tiên tiến gần giống với cấu trúc thần kinh của não người. Trong khi trước đó, Siri (và cả hệ thống nhận dạng giọng nói của nó) sử dụng cách tiếp cận dựa trên quy luật, trong đó các từ hoặc hình ảnh mới chụp được Siri ghi lại sẽ được tái đối chiếu với một một lượng tri thức lớn để nhận dạng hoặc tìm ý nghĩa của chúng. Trợ lý này có thể hiểu được những thứ đào tạo, nhưng không có khả năng học để hiểu những điều mới.

Chỉ đến khi đưa vào các phương pháp tiếp cận trí tuệ nhân tạo để nâng cao kỹ năng nhận thức của Siri, Apple mới bắt đầu đào tạo các mô hình AI theo năng lực tự học.

Mục tiêu của việc này không nhằm tập trung vào xây dựng được mô hình nhận ra chính xác nguồn dữ liệu đào tạo (có thể là một bộ ảnh, các từ hoặc cụm từ) mà nhằm giúp cho mô hình hiểu một loạt các hình ảnh hoặc thuật ngữ để có thể sử dụng trong thực tế đời sống. Do đó, mục đích của việc đào tạo là để mô hình không ngừng kiểm chứng dữ liệu, để trở nên chính xác hơn và giỏi hơn trong việc hiểu được những điều mới.

Hai năm với hướng tư duy mới không phải là một thời gian quá dài, đặc biệt khi so sánh với thời gian mà các đối thủ cạnh tranh của Apple đã dùng để phát triển và triển khai AI. Tuy nhiên, dẫu cho bộ phận Nghiên cứu và Phát triển AI (AI R&D) của Apple không mấy tân tiến như của Google hoặc Facebook, theo một số người đánh giá, công ty có thể bù đắp lại bằng cách áp dụng công nghệ này thông minh hơn.

Nếu Apple có thể trang bị cho Siri các thủ thuật mới hữu ích, thì mọi người sẽ sử dụng vào thực chất hơn cũng như nhận sự tin tưởng của người dùng bằng cách bảo vệ dữ liệu của họ, một chiến lược không chỉ thắng lợi về mặt kinh tế và nhân văn mà còn lâu bền hơn mọi nghiên cứu của các nhà khoa học về AI đơn thuần hiện hay.

Theo Fast Company

BÌNH LUẬN

Please enter your comment!
Please enter your name here