Meta ra mắt AI tự học, mở đường cho AI tự kiểm tra và cải thiện lẫn nhau

Lucia Nguyễn (Theo CNA)

20/10/2024 16:19

Meta vừa công bố mô hình AI tiên tiến có khả năng tự kiểm tra và đánh giá hiệu quả các mô hình khác, đánh dấu bước đột phá trong việc giảm thiểu sự can thiệp của con người trong quá trình phát triển AI. Công cụ "Trình đánh giá tự học" hứa hẹn mở ra kỷ nguyên AI tự động, thông minh hơn, giúp tối ưu hóa quy trình và tạo nền tảng cho sự phát triển của các hệ thống AI tự cải thiện.

5e88fd988e80952be07ab210b5eef903-1729403642.jpeg

Meta, công ty mẹ của Facebook, vừa thông báo về việc phát hành loạt mô hình AI mới từ bộ phận nghiên cứu, trong đó có "Trình đánh giá tự học" – công cụ có khả năng tự kiểm tra và đánh giá công việc của các mô hình AI khác. 

Đây là bước đột phá nhằm giảm thiểu sự can thiệp của con người trong quá trình phát triển AI, hứa hẹn mở ra kỷ nguyên AI có thể tự học hỏi và cải thiện từ chính những sai lầm của mình.

Việc ra mắt này diễn ra sau khi Meta lần đầu giới thiệu công cụ trong một bài báo vào tháng 8. 

Bài báo nhấn mạnh cách "Trình đánh giá tự học" sử dụng kỹ thuật "chuỗi suy nghĩ", phương pháp chia nhỏ các vấn đề phức tạp thành những bước logic đơn giản, tương tự như phương pháp mà OpenAI áp dụng trong các mô hình AI mới nhất. 

Phương pháp này giúp cải thiện đáng kể độ chính xác của các mô hình AI trong các lĩnh vực đòi hỏi tư duy cao như khoa học, toán học, và lập trình.

Điểm đáng chú ý là Meta đã đào tạo mô hình đánh giá của mình hoàn toàn bằng dữ liệu do AI tạo ra, hoàn toàn loại bỏ sự can thiệp của con người trong giai đoạn huấn luyện. 

Điều này không chỉ giúp tối ưu hóa quy trình phát triển mà còn mở ra cơ hội xây dựng những tác nhân AI có khả năng tự học hỏi và đánh giá kết quả của chính mình.

Hai nhà nghiên cứu đứng sau dự án cho biết, khả năng dùng AI để đánh giá AI là một bước tiến quan trọng trong việc phát triển các hệ thống AI tự động. 

Những hệ thống này có thể hoạt động độc lập, học từ sai lầm và thực hiện những nhiệm vụ phức tạp mà không cần sự giám sát của con người.

Trong tương lai, các chuyên gia kỳ vọng những hệ thống AI tự động này sẽ trở thành trợ lý kỹ thuật số thông minh, thực hiện đa dạng nhiệm vụ mà con người thường làm, từ đó tiết kiệm thời gian và công sức. 

Điều này cũng giúp giảm sự phụ thuộc vào quy trình Học tăng cường từ phản hồi của con người (RLHF), vốn yêu cầu những người chú thích có kỹ năng cao để xác minh độ chính xác của dữ liệu và các phản hồi từ AI.

Theo Jason Weston, một trong những nhà nghiên cứu chính của dự án, "Chúng tôi hy vọng rằng khi AI phát triển thông minh hơn, nó sẽ có khả năng tự kiểm tra công việc tốt hơn và ngày càng giỏi hơn con người." Ông cũng nhận định, "Khả năng tự học và tự đánh giá là chìa khóa để đạt tới AI siêu phàm."

Không chỉ Meta, các công ty công nghệ lớn khác như Google và Anthropic cũng đang nghiên cứu về việc Học tăng cường từ phản hồi AI (RLAIF). Tuy nhiên, khác với Meta, các công ty này không công bố rộng rãi mô hình của họ cho công chúng sử dụng.

Cùng với "Trình đánh giá tự học", Meta cũng ra mắt nhiều công cụ AI khác trong lần công bố này, bao gồm phiên bản cập nhật của Segment Anything – công cụ nhận diện hình ảnh giúp tăng tốc quá trình phản hồi của các mô hình ngôn ngữ lớn (LLM), cũng như các tập dữ liệu hỗ trợ trong việc khám phá vật liệu vô cơ mới.

Với những công cụ này, Meta đang dẫn đầu trong việc phát triển AI tự học, tự cải thiện, mở ra tiềm năng cho một tương lai nơi AI có thể vận hành và phát triển mà không cần phụ thuộc quá nhiều vào con người.

Lucia Nguyễn (Theo CNA)