Các nhà nghiên cứu tại Israel kỳ vọng mở ra những khám phá mới về lịch sử Do Thái nhờ đưa cơ sở dữ liệu số gồm hàng nghìn bản thảo kéo dài suốt một thiên niên kỷ vào một công cụ chép lại văn bản mới sử dụng trí tuệ nhân tạo.

Cairo Geniza - bộ sưu tập tài liệu Do Thái thời Trung cổ lớn nhất thế giới - đã được giới học thuật nghiên cứu trong suốt hơn một thế kỷ, nhưng mới chỉ một phần nhỏ trong hơn 400.000 tài liệu của bộ sưu tập này được khảo cứu đầy đủ.

Dù toàn bộ Geniza đã được số hóa và đưa lên mạng dưới dạng hình ảnh, phần lớn tài liệu vẫn chưa được lập danh mục, nhiều bản chỉ là những mảnh rời từ các văn bản dài hơn, và chỉ khoảng 10% có bản chép lại.

Bằng cách huấn luyện một mô hình AI để đọc và chép lại các văn bản cổ, các nhà nghiên cứu có thể truy cập và phân tích toàn bộ bộ sưu tập nhanh hơn nhiều, tra cứu tên hoặc từ khóa, đồng thời ghép các mảnh rời thành văn bản hoàn chỉnh.

Daniel Stokl Ben Ezra, một trong các nhà nghiên cứu chủ chốt của dự án chép lại văn bản MiDRASH, cho biết: “Chúng tôi liên tục tìm cách cải thiện khả năng giải mã chữ viết cổ của máy.”

Ông nói thêm dự án đã đạt được những tiến bộ đáng kể và có thể mở rộng khả năng tiếp cận đối với các tài liệu - được viết bằng tiếng Hebrew, Arab, Aramaic và Yiddish với nhiều dạng chữ viết tay khác nhau - cho đông đảo nhà nghiên cứu.

Các bản chép lại từ những bản thảo khó hơn sẽ được các chuyên gia kiểm định, qua đó tiếp tục cải thiện việc huấn luyện AI.

Dự án, được Hội đồng Nghiên cứu châu Âu, tài trợ dựa trên cơ sở dữ liệu số của Thư viện quốc gia Israel về tài liệu Cairo Geniza, tập hợp các chuyên gia từ nhiều trường đại học và viện nghiên cứu.

Geniza là nơi lưu giữ trong giáo đường dành cho các tài liệu quan trọng, vốn sau cùng sẽ được chôn cất theo nghi lễ. Geniza của giáo đường Ben Ezra tại Cairo cổ có điều kiện khô ráo lý tưởng để bảo tồn giấy cổ.

Trong thời Trung cổ, Cairo vượt qua Damascus và Baghdad để trở thành thành phố lớn nhất Trung Đông, trung tâm của thương mại, học thuật và khoa học, đồng thời là nơi cư trú của cộng đồng Do Thái thịnh vượng.

Nhà triết học Do Thái vĩ đại Maimonides - vị sultan Hồi giáo đánh bại quân Thập tự chinh ở Jerusalem - từng cầu nguyện tại giáo đường Ben Ezra khi sinh sống tại Cairo.

Qua các triều đại và đế chế, cộng đồng nơi đây vẫn âm thầm duy trì nhịp sống thường nhật, các giáo sĩ của họ lấp đầy Geniza bằng tranh luận giáo luật, hồ sơ dân sự và vô số tài liệu hành chính, học thuật khác.

Kho tài liệu đồ sộ này - bao gồm cả những bản viết tay của chính Maimonides - được phát hiện vào cuối thế kỷ 19. Dù đã được nghiên cứu hơn 100 năm, quy mô khổng lồ của nó đồng nghĩa với việc vẫn còn nhiều khoảng trống lớn.

Stokl Ben Ezra nhấn mạnh: “Khả năng tái dựng lại - tạo nên một dạng ‘Facebook của thời Trung cổ’ - đang ngay trước mắt chúng ta”./.

