Chatbot AI của Google vượt qua bài kiểm tra cấp phép hành nghề y ở Mỹ

Chatbot y tế hỗ trợ trí tuệ nhân tạo của Google đã đạt điểm vượt qua trong kỳ thi cấp phép y tế khó khăn của Mỹ, nhưng câu trả lời của nó vẫn không bằng các bác sỹ.
Chatbot AI của Google vượt qua bài kiểm tra cấp phép hành nghề y ở Mỹ ảnh 1(Nguồn: AFP)Nhập mô tả cho ảnh

Chatbot sử dụng trí tuệ nhân tạo (AI) chuyên biệt cho lĩnh vực y tế do Google phát triển, Med-PaLM, đã đạt điểm đỗ bài thi sát hạch cấp phép hành nghề y của Mỹ, song các câu trả lời của chatbot này được đánh giá là vẫn chưa thể sánh bằng các bác sỹ.

Kết luận này được đưa ra trong nghiên cứu đã được chuyên gia thẩm định và công bố trên tạp chí Nature ngày 12/7.

Google lần đầu tiết lộ về chatbot mới này trong một nghiên cứu công bố tháng 12/2022 nhưng chưa được áp dụng phổ biến.

Chatbot với tên gọi Med-PaLM được phát triển trên cơ sở của PaLM, mô hình ngôn ngữ lớn (LLM) mới nhất và tiên tiến nhất của Google.

Với đặc thù về y tế, Med-PaLM được cho là có thể đưa ra các câu trả lời chuyên ngành y tế chất lượng hơn so với các chatbot thông thường khác.

Một số ý kiến chuyên gia cho rằng Med-PaLM sẽ rất hữu ích tại các quốc gia "hạn chế về khả năng tiếp cận các y, bác sỹ."

[Chatbot trí tuệ nhân tạo có thể thay con người trong trị liệu?]

Nghiên cứu trên Nature cho biết Med-PaLM đã đạt được điểm số 67,6% đối với bài kiểm tra trắc nghiệm Thi cấp phép y tế (USMLE) của Mỹ, vượt tỷ lệ đạt tối thiểu là 60%. Nghiên cứu nêu rõ chuyên môn về y khoa của Med-PaLM khá tốt song vẫn chưa thể bằng các y, bác sỹ.

Google khẳng định Med-PaLM là công cụ mô hình ngôn ngữ lớn (LLM) đầu tiên đỗ USMLE.

Một nghiên cứu được công bố hồi tháng Năm vừa qua cho biết Med-PaLM 2 đạt được điểm số 86,5% trong bài kiểm tra USMLE, cao điểm hơn chatbot phiên bản gốc, song nghiên cứu này chưa được các chuyên gia khác thẩm định để có thể khẳng định độ chính xác.

Ngoài Med-PaLM, chatbot ChatGPT của OpenAI cũng được cho là gần như có thể vượt qua bài thi này. 

Chuyên gia khoa học máy tính tại Đại học Bath của Vương quốc Anh James Davenport, nhấn mạnh "có sự khác biệt lớn trong việc trả lời câu hỏi y khoa và xử lý tính huống thực tiễn, bao gồm việc chẩn đoán và đưa ra phương pháp điều trị."

Trong khi đó, chuyên gia về AI của Đại học Leeds, Anthony Cohn, cho rằng khả năng chatbot đưa ra thông tin sai lệch vẫn khá lớn đối với các mô hình trên cơ sở LLM, do bản chất mang tính thống kê của hệ thống này. Do đó, ông cho rằng chỉ nên sử dụng các chatbot này như một trợ lý, thay vì như một bác sỹ thật có quyền quyết định việc chữa trị bệnh nhân./.

(TTXVN/Vietnam+)

Tin cùng chuyên mục