Một thí nghiệm dùng ChatGPT

 

ChatGPT_First3months.jpg

Phạm Vũ Thịnh

Phần 1: ChatGPT làm thơ tiếng Anh

Hiện nay, ChatGPT đang là đề tài thời thượng làm náo động dư luận khắp nơi trên thế giới, và Donald Trump đang vận động hướng đến kỳ bầu cử Tổng thống năm 2024.

Tôi thử nhờ ChatGPT làm cho một bài thơ theo thể Limerick về Trump vận động tranh cử xem sao, và được ChatGPT làm cho bài sau đây:

There once was a man named Trump,
Whose political ambitions did thump,
He lost the last race,
But still wants to chase,
The White House, a victory to pump.

With hair like a bird's messy nest,
And a tweeting habit he can't divest,
He's hitting the trail,
With a boastful exhale,
And claiming he's still the best.

But many are tired of his act,
His divisive words and attacks,
They hope he'll retire,
And his dreams will expire,
And fade away like an old hat.

So will he make another run?
And try for a win that he's already spun?
Only time will tell,
But one thing is quite swell,
The memes and jokes will never be done.


*

Limerick là thể thơ ngắn gồm năm ḍng: Hai ḍng đầu mỗi ḍng có tám/chín từ; hai ḍng tiếp theo ngắn hơn, có năm/sáu từ; và ḍng cuối cùng kết luận với tám/chín từ; có vần chân (cước vận) nghiêm chỉnh AABBA. Mỗi bài thơ thường kể một câu chuyện hài hước, dùng từ diễu cợt.

Trong ṿng vài mươi giây, ChatGPT đă sáng tác không chỉ một mà đến 4 bài Limerick! Đúng quy luật về số ḍng số chữ (metrics) và vần điệu (rhyme), cả 4 bài đều đọc lên nghe được lắm, ngang ngửa với người biết làm thơ.

*

Hứng thú với kết quả đó, tôi bèn thử nhờ làm tiếp một bài theo thể thơ Sonnet, về chuyện Trump vẫn khoe ḿnh là "thiên tài an định - stable genius" và là "nhà ái quốc - patriot." ChatGPT đă viết ra như sau:

Amidst the tweets and media fights,
A voice rises loud and clear,
"I'm a genius, a man of great might,
And a patriot, beyond any fear."

The man behind this bold claim,
Is none other than Donald Trump,
With ego as big as his name,
And a tongue that always jumps.

He claims to know all the best words,
And the best people too,
But his actions and deeds are absurd,
And his words are often untrue.

Yet he stands there with pride and might,
A self-proclaimed genius and patriot,
But many know his words aren't right,
And his claims are often chaotic.

So let us hope that he'll soon retire,
And leave the rest of us to aspire.

*

Các bài sonnet của Shakespeare thường gồm 3 khổ thơ 4 ḍng và khổ kết 2 ḍng, tổng cộng 14 ḍng.

Bài Sonnet d'Arvers bằng tiếng Pháp được nhiều người Việt biết đến th́ có 2 khổ thơ 4 ḍng rồi 2 khổ 3 ḍng, tổng cộng cũng 14 ḍng; đă được Khái Hưng dịch thành bài thơ "T́nh Tuyệt Vọng" được yêu thích qua nhiều thế hệ người Việt. "Lạnh lùng ḷng sẻ hỏi ḷng, Người đâu tả ở mấy ḍng thơ đây?"

Bài sonnet do ChatGPT sáng tác đă cho thêm 1 khổ 4 ḍng, thành 16 ḍng. Vần chân cách ḍng đúng theo quy định. Bố cục chặt chẽ: đề, phá, thừa, kết đầy đủ tuy có hơi máy móc. Nội dung trung thực, là điều đáng quư trong thời buổi thông tin nhiễu nhương đầy fake news ngày nay. Chữ nghĩa giản dị mà hóm hỉnh, nhất là đoạn "With ego as big as his name, And a tongue that always jumps" th́ lột tả được rất tài t́nh và chính xác cá tính của nhân vật. Tôi nghĩ là giám khảo nào có khó tính đến mấy cũng cho điểm bài sonnet này trên trung b́nh.
 

Phần 2: ChatGPT làm thơ tiếng Việt
 

ChatGPT phục vụ nhiều thứ ngôn ngữ, trong đó có tiếng Việt. Tôi thử xem khả năng của ChatGPT trong tiếng Việt ra sao, với vài câu hỏi, và lời đáp như sau (nguyên văn):

ChatGPT có biết thể thơ lục bát, song thất lục bát, thất ngôn tứ tuyệt và thơ Đường luật không?

*

Có, ChatGPT có thể biết về những thể thơ mà bạn đề cập.

Thể thơ lục bát là một thể thơ truyền thống của Việt Nam, gồm 6 câu vần thơ mỗi bài, mỗi câu có 8 âm tiết.

Thể thơ "song thất lục bát" là một sáng tác thơ ca phức tạp hơn, với 8 câu vần thơ mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.

Thể thơ "thất ngôn tứ tuyệt" là một thể thơ ngắn gọn với 4 câu vần thơ mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.

Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần thơ.

Tuy nhiên, ChatGPT là một chương tŕnh máy tính và không có khả năng cảm nhận được thơ ca hay văn chương như con người. ChatGPT chỉ có khả năng sinh ra và phân tích các chuỗi kư tự để tạo ra các câu văn hay thơ ca dựa trên mô h́nh ngôn ngữ và các thuật toán học máy.

*

Các thể thơ nói trên th́, thơ lục bát hầu như ai cũng biết qua ca dao, và các truyện thơ dân gian khác; và học sinh trung học đều có học Truyện Kiều - Nguyễn Du, Chinh phụ ngâm - Đoàn thị Điểm, Nam quốc sơn hà - Lư Thường Kiệt, Qua đèo Ngang - Bà Huyện Thanh Quan, nên không lạ ǵ các thể thơ đó.

Thế nên không biết ChatGPT đă dựa vào đâu mà giải thích lạng quạng đến mức khó tin được về các thể thơ tiếng Việt như thế.

Đặc biệt về thể thơ Đường luật ChatGPT đă trả lời là biết, rằng:

"Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần thơ."

Tôi suy đoán rằng trong kho dữ liệu của ChatGPT (hay GPT-3, bao phủ thông tin cho đến trọn năm 2021, có 175 tỉ thông số - parameter, theo báo chí cho biết) hẳn đang có thông tin "Thơ Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần" thật, nhưng chỉ có thế thôi.

Phần c̣n lại, ChatGPT đă đoán ṃ (theo thuật toán - algorithm) là năm "bộ phận vần" mà mỗi bộ phận vần là bốn câu (theo thể thơ mà ChatGPT rất "ưng ư" và dùng nhiều trong các "tác phẩm thơ" của ChatGPT trong tiếng Anh và cả tiếng Việt nữa, ChatGPT gọi đó là thể thơ Free Verse, nhưng thật sự không phải "thơ tự do - Free Verse" mà là loại thơ tiếng Anh có vần chân cho từng cặp hai ḍng tiếp nhau hay cách nhau).

Thế nên ChatGPT đă tính ra rằng bài thơ Đường luật "chắc hẳn" là gồm 20 câu! Và ChatGPT đă mạnh dạn cho biết "tổng cộng 20 câu vần thơ"!

Chưa kể cụm từ "câu vần thơ" trong lời đáp của ChatGPT không đúng tiếng Việt, mà phải là: câu thơ (có) vần.

Lời đáp như thế khiến phải nghi ngờ, nên tôi hỏi tiếp và được trả lời như sau (nguyên văn):

ChatGPT có thể làm được thơ theo các thể thơ đó hay chưa?

*

Có, ChatGPT có khả năng tạo ra các bài thơ theo các thể thơ như lục bát, thất ngôn tứ tuyệt, thơ Đường luật và nhiều thể thơ khác.

Tuy nhiên, đôi khi những bài thơ do ChatGPT tạo ra có thể không mang lại cảm giác tự nhiên hoặc không hoàn toàn rơ ràng. Điều này là bởi v́ ChatGPT không có khả năng cảm nhận hay hiểu được t́nh cảm hay ngữ nghĩa của từng từ trong bài thơ. ChatGPT chỉ có thể sử dụng mô h́nh ngôn ngữ và các thuật toán học máy để phân tích các dữ liệu ngôn ngữ và tạo ra các bài thơ mới.

V́ vậy, bài thơ được tạo ra bởi ChatGPT có thể hữu ích trong việc đưa ra những ư tưởng mới hoặc kích thích sự sáng tạo, nhưng chúng không thể thay thế được những bài thơ được tạo ra bởi con người với cảm xúc và trí tưởng tượng riêng.

*

Tôi thử xem có thật ChatGPT làm được thơ lục bát (là thể thơ dễ làm và phổ biến nhất ở VN), như ChatGPT đă cho biết, hay không. Kết quả là (nguyên văn):

Làm thơ lục bát châm biếm về sở trường của ChatGPT xem sao.

*

Nằm mơ nhưng không ghi lại
Đôi lần lại bị quên ngay
ChatGPT vốn sở trường là
Nhớ kiến thức tới muôn đời

Hỏi sao lại cứ đem ra
Dịch lời tiếng Anh đến ta
T́nh cảm ơi sao xa vời
Chỉ c̣n lại măi ḍng ta

Máy móc học đ̣i năng lực
Giải bài toán, trả lời nhục
Làm thơ chăng chỉ là thế
Nhưng đôi lúc cũng bị bắt nạt

ChatGPT hỡi đừng tự tin
Sở trường vốn chẳng phải tin
Cứ học hỏi thêm từng ngày
Để có thể chinh phục t́nh.

*

Bài này của ChatGPT hoàn toàn chẳng phải là thơ lục bát như đă được nhờ làm, mà cũng chẳng giống tí ǵ với lời giải thích về thể thơ lục bát của chính ChatGPT! Và thú thật có rất nhiều câu, nhiều từ ngữ tôi chẳng hiểu đă được lắp ghép với nhau theo quy luật hay luận lư ǵ. "Chỉ c̣n lại măi ḍng ta", "Giải bài toán, trả lời nhục", "Sở trường vốn chẳng phải tin",... chẳng hạn. Và câu "Hỏi sao lại cứ đem ra, Dịch lời tiếng Anh đến ta" khiến tôi ngờ rằng ChatGPT đă phải dùng đến bộ máy phiên dịch Việt Anh - Anh Việt trong quá tŕnh chọn từ và sắp xếp thành câu tiếng Việt! Ngay cả h́nh thức thơ cũng có vẻ thuộc loại Free Verse trong thơ tiếng Anh, mà ChatGPT ưa dùng khi được nhờ làm thơ tiếng Anh.

Vẫn c̣n choáng váng v́ hồi đáp vừa rồi, tôi thử xem có thật như ChatGPT đă cho biết là ChatGPT làm được thơ Đường luật (là thể thơ có quy luật khó khăn bậc nhất), hay không, và nhận được kết quả như sau (nguyên văn):

Làm thơ Đường luật châm biếm về sở đoản của ChatGPT xem sao.

*

ChatGPT vốn nhiệt t́nh học tập
Lần theo ḍng kiến thức đầy cạn
Nâng cao tŕnh độ, tay nghề đa dạng
Để khách hàng măi tin tưởng sử dụng

Tuy nhiên, sở đoản của nó cũng không ít
Thỉnh thoảng không hiểu câu hỏi người dùng
Trả lời chưa đúng, hay vô căn cứ
Ai biết đâu bằng trực giác của con người

Đường luật đă khuyên rằng: "Học nhiều thuộc ít"
Ai hay dùng những từ ngữ vô nghĩa
Chắc chắn sẽ không thể giải quyết được vấn đề
ChatGPT hỡi, hăy học theo lời thánh thông.

*

Lại cũng như bài trước, bài này của ChatGPT hoàn toàn chẳng phải là thơ Đường luật như đă được nhờ làm, mà cũng chẳng giống với lời giải thích về thể thơ Đường luật của chính ChatGPT! ChatGPT vừa bảo là "hiểu" bài thơ Đường luật gồm 20 câu, 5 "bộ phận vần", thế mà thực tế lại làm ra một bài chỉ có 12 câu, và chẳng có vần nào! Và có câu dùng từ ngữ tôi chẳng hiểu đă được lắp ghép với nhau theo quy luật hay luận lư ǵ. "Ai biết đâu bằng trực giác của con người", "Đường luật đă khuyên rằng: Học nhiều thuộc ít" chẳng hạn.

Phần 3: Vấn đề ngôn ngữ

Các ví dụ vừa rồi cho thấy rằng: hiện tại, khả năng phục vụ của ChatGPT trong tiếng Anh so với trong tiếng Việt khác biệt đến một trời một vực.

Điều này không khó hiểu, bởi tất cả các cơ cấu chính của ChatGPT đều xây dựng trên nền tảng là tiếng Anh Mỹ, từ các kho dữ liệu khổng lồ (database), các mô thức hoạt động (model), các thuật toán (algorithm) cho đến các ngôn ngữ lập tŕnh (programming language),... tất thảy đều biểu hiện bằng Anh ngữ, trước khi mă hóa thành số cho máy tính xử lư.

Và loại dữ liệu đặc biệt của các xă hội dùng ngôn ngữ khác tiếng Anh th́ không có sẵn đến gần được mức đầy đủ như của cộng đồng Anh ngữ. Điều này phản ánh t́nh h́nh số lượng tích lũy của sách báo, văn kiện, tư liệu của các xă hội phi-Anh-ngữ kém xa số lượng của cộng đồng ngôn ngữ Anh Mỹ.

Lại nữa, tất cả các ứng dụng cho mọi ngôn ngữ khác đều qua những mô thức chuyên biệt và bộ máy phiên dịch, lại cũng được xây dựng trên nền tảng là Anh ngữ. Mà hiện tại, khả năng dịch thuật và các mô thức riêng cho ngôn ngữ ngoài tiếng Anh đều chưa đạt đến tŕnh độ và phẩm chất đủ để thành sản phẩm thương mại. Đưa đến t́nh trạng khả năng phục vụ cho các ngôn ngữ khác tiếng Anh th́ kém xa khả năng trong tiếng Anh.

Mà khác biệt đến một trời một vực này giữa ứng dụng tiếng Anh và ngôn ngữ nào khác, th́ không chỉ với ChatGPT, đây là t́nh trạng chung cho mọi ứng dụng AI (artificial intelligence – trí tuệ nhân tạo).

T́nh trạng như thế kéo dài làm nổi cộm lên vấn đề này: Sự thiệt tḥi của người không biết tiếng Anh. Và gần gũi hơn, thiết thân hơn, là vấn đề:

Sự thiệt tḥi của người chỉ biết tiếng Việt.

Tất nhiên, thiệt tḥi đó không phải đến bây giờ mới có, hay mới được phát hiện, mà xưa nay vẫn có và được cảm nhận ít nhiều trong giới người Việt có quan tâm hay có giao tiếp với hải ngoại.

Ngày nay, AI hiện diện trong phần lớn các hoạt động công nghiệp, doanh nghiệp, và ngay cả trong sinh hoạt thường nhật của người tiêu dùng, dần dần nắm một vai tṛ chủ đạo trong cuộc cách mạng kỹ nghệ lần thứ ba đang tiến hành với trung tâm là năng lượng tái tạo, công nghệ IT và mạng lưới nối mọi thứ (IOT - Internet of Things).

Trong bối cảnh như thế, thiệt tḥi của người chỉ biết tiếng Việt nổi bật lên, đ̣i hỏi sự quan tâm đúng mức và thảo luận nghiêm túc, hướng đến một đối sách hữu hiệu và khả thi.

Và yêu cầu ấy càng ngày càng cấp bách thêm, theo với mức độ phổ cập càng ngày càng rộng lớn và nhanh chóng của AI.

*

Thiệt tḥi về ngôn ngữ trong bối cảnh toàn cầu hóa và trí tuệ nhân tạo hiện tại của thế giới là điều quan trọng cực độ nếu nhận thức rằng: Ngôn ngữ giữ vai tṛ quan trọng bậc nhất trong tŕnh độ văn minh của cộng đồng.

Điều dễ nhận thấy là: ngôn ngữ và văn minh song hành và tương trợ nhau. Văn minh tiến lên th́ ngôn ngữ giàu thêm nhiều thuật ngữ mới; và ngôn ngữ giàu thêm cho kịp thời đại lại thúc đẩy văn minh tiến lên. Cứ thế mà h́nh thành một ṿng tṛn tích cực để phát triển và tiến bộ.

Bởi văn minh là kết quả của sự tích lũy (cả trong thời gian, qua các thời đại, và không gian, qua các địa phương) những thành quả đă đạt được từ tiến bộ khoa học kỹ thuật (cả tự nhiên và nhân văn), mà những thành quả này là từ suy nghĩ của con người.

Con người suy nghĩ bằng ngôn ngữ, một khi vượt qua thời kỳ thơ ấu chưa biết nói. Và ở tŕnh độ cao hơn th́ con người suy nghĩ bằng chữ viết, khi đă đọc nhiều văn kiện, sách báo, và nhất là hiểu biết, ghi nhớ bằng chữ những khái niệm trừu tượng và có nội hàm bao quát.

Người sống song ngữ hay đa ngữ hiểu rằng khi nói tiếng Anh th́ ḿnh suy nghĩ bằng tiếng Anh, mà khi nói tiếng Việt th́ suy nghĩ bằng tiếng Việt,... một cách tự nhiên và nhanh chóng hơn là phải phiên dịch qua lại hai thứ ngôn ngữ ấy.

Nếu ngữ vựng không có đủ thuật ngữ cho kịp với tŕnh độ văn minh cao nhất trên thế giới hiện tại, th́ người ta không thể có tư duy sáng tạo về khoa học kỹ thuật được. Có nghĩa là tŕnh độ văn minh của dân tộc dựa vào ngôn ngữ đó không thể tiến theo kịp với thời đại.

Có thể nói rằng văn minh được xây dựng trên nền tảng là ngôn ngữ.

Và cũng có thể mạnh dạn mà suy đoán rằng ngôn ngữ đă có trước văn minh, lịch sử của ngôn ngữ lâu dài hơn lịch sử văn minh. Thử tưởng tượng xem từ ban sơ, con người sống đơn độc, tự do hoàn toàn và hoàn toàn không có khái niệm về tự do. Nhưng khi bắt đầu sống chung đụng với người khác th́ tự nhiên nảy sinh nhu cầu truyền đạt ư chí, từ đó phát sinh ra ngôn ngữ, trước hết là tiếng nói, và khá lâu về sau, là chữ viết.

Chỉ từ khi có chữ viết th́ mới có công cụ để tích lũy, cả trong thời gian tức là qua các thời kỳ tiếp nối, và không gian, qua nhiều địa phương trong cùng thời kỳ. Trên nền tảng dần cao hơn và vững chắc hơn, con người phát kiến và phát minh càng ngày càng nhiều, giúp xă hội con người càng phát triển - tiến bộ, làm nảy sinh ra khái niệm gọi là văn minh, tức là tŕnh độ phát triển trong sinh hoạt của các cộng đồng nhân loại.

Văn minh là kết quả của sự tích lũy ấy.

Và nền tảng của văn minh là ngôn ngữ.

Phạm Vũ Thịnh
Sydney, 09/03/2023

 


® "Khi phát hành lại thông tin từ trang này cần phải có sự đồng ư của tác giả 
và ghi rơ nguồn lấy từ www.erct.com"

Cảm tưởng, ư kiến xin gởi về  t4phamvu@hotmail.com