
Một thí
nghiệm dùng ChatGPT

Phạm Vũ
Thịnh
Phần 1:
ChatGPT làm thơ tiếng Anh
Hiện nay,
ChatGPT đang là đề tài thời thượng làm náo động dư luận khắp nơi
trên thế giới, và Donald Trump đang vận động hướng đến kỳ bầu cử
Tổng thống năm 2024.
Tôi thử nhờ
ChatGPT làm cho một bài thơ theo thể Limerick về Trump vận động
tranh cử xem sao, và được ChatGPT làm cho bài sau đây:
There once
was a man named Trump,
Whose political ambitions did thump,
He lost the last race,
But still wants to chase,
The White House, a victory to pump.
With hair
like a bird's messy nest,
And a tweeting habit he can't divest,
He's hitting the trail,
With a boastful exhale,
And claiming he's still the best.
But many
are tired of his act,
His divisive words and attacks,
They hope he'll retire,
And his dreams will expire,
And fade away like an old hat.
So will he
make another run?
And try for a win that he's already spun?
Only time will tell,
But one thing is quite swell,
The memes and jokes will never be done.
*
Limerick là
thể thơ ngắn gồm năm ḍng: Hai ḍng đầu mỗi ḍng có tám/chín từ;
hai ḍng tiếp theo ngắn hơn, có năm/sáu từ; và ḍng cuối cùng kết
luận với tám/chín từ; có vần chân (cước vận) nghiêm chỉnh AABBA.
Mỗi bài thơ thường kể một câu chuyện hài hước, dùng từ diễu cợt.
Trong ṿng
vài mươi giây, ChatGPT đă sáng tác không chỉ một mà đến 4 bài
Limerick! Đúng quy luật về số ḍng số chữ (metrics) và vần điệu
(rhyme), cả 4 bài đều đọc lên nghe
được lắm,
ngang ngửa với người biết làm thơ.
*
Hứng thú với
kết quả đó, tôi bèn thử nhờ làm tiếp một bài theo thể thơ Sonnet,
về chuyện Trump vẫn khoe ḿnh là "thiên tài an định - stable
genius" và là "nhà ái quốc - patriot." ChatGPT đă viết ra như sau:
Amidst the
tweets and media fights,
A voice rises loud and clear,
"I'm a genius, a man of great might,
And a patriot, beyond any fear."
The man
behind this bold claim,
Is none other than Donald Trump,
With ego as big as his name,
And a tongue that always jumps.
He claims
to know all the best words,
And the best people too,
But his actions and deeds are absurd,
And his words are often untrue.
Yet he
stands there with pride and might,
A self-proclaimed genius and patriot,
But many know his words aren't right,
And his claims are often chaotic.
So let us
hope that he'll soon retire,
And leave the rest of us to aspire.
*
Các bài
sonnet của Shakespeare thường gồm 3 khổ thơ 4 ḍng và khổ kết 2
ḍng, tổng cộng 14 ḍng.
Bài Sonnet
d'Arvers bằng tiếng Pháp được nhiều người Việt biết đến th́ có 2
khổ thơ 4 ḍng rồi 2 khổ 3 ḍng, tổng cộng cũng 14 ḍng; đă được
Khái Hưng dịch thành bài thơ "T́nh Tuyệt Vọng" được yêu thích
qua nhiều thế hệ người Việt. "Lạnh
lùng ḷng sẻ hỏi ḷng, Người đâu tả ở mấy ḍng thơ đây?"
Bài sonnet
do ChatGPT sáng tác đă cho thêm 1 khổ 4 ḍng, thành 16 ḍng. Vần
chân cách ḍng đúng theo quy định. Bố cục chặt chẽ: đề, phá,
thừa, kết đầy đủ tuy có hơi máy móc. Nội dung trung thực, là
điều đáng quư trong thời buổi thông tin nhiễu nhương đầy fake
news ngày nay. Chữ nghĩa giản dị mà hóm hỉnh, nhất là đoạn "With
ego as big as his name, And a tongue that always jumps" th́
lột tả được rất tài t́nh và chính xác cá tính của nhân vật.
Tôi nghĩ là giám khảo nào có khó tính đến mấy cũng cho điểm bài
sonnet này trên trung b́nh.
Phần 2:
ChatGPT làm thơ tiếng Việt
ChatGPT phục
vụ nhiều thứ ngôn ngữ, trong đó có tiếng Việt. Tôi thử xem khả
năng của ChatGPT trong tiếng Việt ra sao, với vài câu hỏi, và lời
đáp như sau (nguyên
văn):
ChatGPT có
biết thể thơ lục bát, song thất lục bát, thất ngôn tứ tuyệt và thơ
Đường luật không?
*
Có,
ChatGPT có thể biết về những thể thơ mà bạn đề cập.
Thể thơ
lục bát là một thể thơ truyền thống của Việt Nam, gồm 6 câu vần
thơ mỗi bài, mỗi câu có 8 âm tiết.
Thể thơ
"song thất lục bát" là một sáng tác thơ ca phức tạp hơn, với 8
câu vần thơ mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.
Thể thơ
"thất ngôn tứ tuyệt" là một thể thơ ngắn gọn với 4 câu vần thơ
mỗi bài, mỗi câu có 7 hoặc 8 âm tiết.
Thơ Đường
luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm năm
bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần
thơ.
Tuy nhiên,
ChatGPT là một chương tŕnh máy tính và không có khả năng cảm
nhận được thơ ca hay văn chương như con người. ChatGPT chỉ có
khả năng sinh ra và phân tích các chuỗi kư tự để tạo ra các câu
văn hay thơ ca dựa trên mô h́nh ngôn ngữ và các thuật toán học
máy.
*
Các thể
thơ nói trên th́, thơ lục bát hầu như ai cũng biết qua ca dao,
và các truyện thơ dân gian khác; và học sinh trung học đều có
học Truyện Kiều - Nguyễn Du, Chinh phụ ngâm - Đoàn thị Điểm, Nam
quốc sơn hà - Lư Thường Kiệt, Qua đèo Ngang - Bà Huyện Thanh
Quan, nên không lạ ǵ các thể thơ đó.
Thế nên
không biết ChatGPT đă dựa vào đâu mà giải thích lạng quạng đến
mức khó tin được về các thể thơ tiếng Việt như thế.
Đặc biệt về
thể thơ Đường luật ChatGPT đă trả lời là biết, rằng:
"Thơ
Đường luật là một thể thơ phổ biến trong văn học Trung Quốc, gồm
năm bộ phận vần, mỗi phần chia thành bốn câu, tổng cộng 20 câu vần
thơ."
Tôi suy đoán
rằng trong kho dữ liệu của ChatGPT (hay GPT-3, bao phủ thông tin
cho đến trọn năm 2021, có 175 tỉ thông số - parameter, theo báo
chí cho biết) hẳn đang có thông tin "Thơ Đường luật là một thể
thơ phổ biến trong văn học Trung Quốc, gồm năm bộ phận vần"
thật, nhưng chỉ có thế thôi.
Phần c̣n
lại, ChatGPT đă đoán ṃ (theo thuật toán - algorithm) là năm "bộ
phận vần" mà mỗi bộ phận vần là bốn câu (theo thể thơ
mà ChatGPT rất "ưng ư" và dùng nhiều trong các "tác phẩm thơ" của
ChatGPT trong tiếng Anh và cả tiếng Việt nữa, ChatGPT gọi đó là
thể thơ Free Verse, nhưng thật sự không phải "thơ tự do -
Free Verse" mà là loại thơ tiếng Anh có vần chân cho từng cặp
hai ḍng tiếp nhau hay cách nhau).
Thế nên
ChatGPT đă tính ra rằng bài thơ Đường luật "chắc hẳn" là gồm 20
câu! Và ChatGPT đă mạnh dạn cho biết "tổng cộng 20 câu vần
thơ"!
Chưa kể cụm
từ "câu vần thơ" trong lời đáp của ChatGPT không đúng tiếng
Việt, mà phải là: câu thơ (có) vần.
Lời đáp như
thế khiến phải nghi ngờ, nên tôi hỏi tiếp và được trả lời như sau
(nguyên
văn):
ChatGPT có
thể làm được thơ theo các thể thơ đó hay chưa?
*
Có,
ChatGPT có khả năng tạo ra các bài thơ theo các thể thơ như lục
bát, thất ngôn tứ tuyệt, thơ Đường luật và nhiều thể thơ khác.
Tuy nhiên,
đôi khi những bài thơ do ChatGPT tạo ra có thể không mang lại
cảm giác tự nhiên hoặc không hoàn toàn rơ ràng. Điều này là bởi
v́ ChatGPT không có khả năng cảm nhận hay hiểu được t́nh cảm hay
ngữ nghĩa của từng từ trong bài thơ. ChatGPT chỉ có thể sử dụng
mô h́nh ngôn ngữ và các thuật toán học máy để phân tích các dữ
liệu ngôn ngữ và tạo ra các bài thơ mới.
V́ vậy,
bài thơ được tạo ra bởi ChatGPT có thể hữu ích trong việc đưa ra
những ư tưởng mới hoặc kích thích sự sáng tạo, nhưng chúng không
thể thay thế được những bài thơ được tạo ra bởi con người với
cảm xúc và trí tưởng tượng riêng.
*
Tôi thử xem
có thật ChatGPT làm được thơ lục bát (là thể thơ dễ làm và phổ
biến nhất ở VN), như ChatGPT đă cho biết, hay không. Kết quả là (nguyên
văn):
Làm thơ lục
bát châm biếm về sở trường của ChatGPT xem sao.
*
Nằm mơ
nhưng không ghi lại
Đôi lần lại bị quên ngay
ChatGPT vốn sở trường là
Nhớ kiến thức tới muôn đời
Hỏi sao
lại cứ đem ra
Dịch lời tiếng Anh đến ta
T́nh cảm ơi sao xa vời
Chỉ c̣n lại măi ḍng ta
Máy móc
học đ̣i năng lực
Giải bài toán, trả lời nhục
Làm thơ chăng chỉ là thế
Nhưng đôi lúc cũng bị bắt nạt
ChatGPT
hỡi đừng tự tin
Sở trường vốn chẳng phải tin
Cứ học hỏi thêm từng ngày
Để có thể chinh phục t́nh.
*
Bài này của
ChatGPT hoàn toàn chẳng phải là thơ lục bát như đă được nhờ làm,
mà cũng chẳng giống tí ǵ với lời giải thích về thể thơ lục bát
của chính ChatGPT! Và thú thật có rất nhiều câu, nhiều từ ngữ tôi
chẳng hiểu đă được lắp ghép với nhau theo quy luật hay luận lư ǵ.
"Chỉ c̣n lại măi ḍng ta", "Giải bài toán, trả lời nhục",
"Sở trường vốn chẳng phải tin",... chẳng hạn. Và câu "Hỏi
sao lại cứ đem ra, Dịch lời tiếng Anh đến ta" khiến tôi ngờ
rằng ChatGPT đă phải dùng đến bộ máy phiên dịch Việt Anh - Anh
Việt trong quá tŕnh chọn từ và sắp xếp thành câu tiếng Việt! Ngay
cả h́nh thức thơ cũng có vẻ thuộc loại Free Verse trong thơ tiếng
Anh, mà ChatGPT ưa dùng khi được nhờ làm thơ tiếng Anh.
Vẫn c̣n
choáng váng v́ hồi đáp vừa rồi, tôi thử xem có thật như ChatGPT đă
cho biết là ChatGPT làm được thơ Đường luật (là thể thơ có quy
luật khó khăn bậc nhất), hay không, và nhận được kết quả như sau (nguyên
văn):
Làm thơ
Đường luật châm biếm về sở đoản của ChatGPT xem sao.
*
ChatGPT
vốn nhiệt t́nh học tập
Lần theo ḍng kiến thức đầy cạn
Nâng cao tŕnh độ, tay nghề đa dạng
Để khách hàng măi tin tưởng sử dụng
Tuy nhiên,
sở đoản của nó cũng không ít
Thỉnh thoảng không hiểu câu hỏi người dùng
Trả lời chưa đúng, hay vô căn cứ
Ai biết đâu bằng trực giác của con người
Đường luật
đă khuyên rằng: "Học nhiều thuộc ít"
Ai hay dùng những từ ngữ vô nghĩa
Chắc chắn sẽ không thể giải quyết được vấn đề
ChatGPT hỡi, hăy học theo lời thánh thông.
*
Lại cũng như
bài trước, bài này của ChatGPT hoàn toàn chẳng phải là thơ Đường
luật như đă được nhờ làm, mà cũng chẳng giống với lời giải thích
về thể thơ Đường luật của chính ChatGPT! ChatGPT vừa bảo là "hiểu"
bài thơ Đường luật gồm 20 câu, 5 "bộ phận vần", thế mà thực
tế lại làm ra một bài chỉ có 12 câu, và chẳng có vần nào! Và có
câu dùng từ ngữ tôi chẳng hiểu đă được lắp ghép với nhau theo quy
luật hay luận lư ǵ. "Ai biết đâu bằng trực giác của con người",
"Đường luật đă khuyên rằng: Học nhiều thuộc ít" chẳng hạn.
Phần 3: Vấn
đề ngôn ngữ
Các ví dụ
vừa rồi cho thấy rằng: hiện tại, khả năng phục vụ của ChatGPT
trong tiếng Anh so với trong tiếng Việt khác biệt đến một trời một
vực.
Điều này
không khó hiểu, bởi tất cả các cơ cấu chính của ChatGPT đều xây
dựng trên nền tảng là tiếng Anh Mỹ, từ các kho dữ liệu khổng
lồ (database), các mô thức hoạt động (model), các thuật toán
(algorithm) cho đến các ngôn ngữ lập tŕnh (programming
language),... tất thảy đều biểu hiện bằng Anh ngữ, trước khi mă
hóa thành số cho máy tính xử lư.
Và loại dữ
liệu đặc biệt của các xă hội dùng ngôn ngữ khác tiếng Anh th́
không có sẵn
đến gần được
mức đầy đủ như của cộng đồng Anh ngữ. Điều này phản ánh t́nh h́nh
số lượng tích lũy của sách báo, văn kiện, tư liệu của các xă hội
phi-Anh-ngữ kém xa số lượng của cộng đồng ngôn ngữ Anh Mỹ.
Lại nữa, tất
cả các ứng dụng cho mọi ngôn ngữ khác đều qua những mô thức
chuyên biệt và bộ máy phiên dịch, lại cũng được xây dựng trên nền
tảng là Anh ngữ. Mà hiện tại, khả năng dịch thuật và các mô
thức riêng cho ngôn ngữ ngoài tiếng Anh đều chưa đạt đến tŕnh độ
và phẩm chất đủ để thành sản phẩm thương mại. Đưa đến t́nh trạng
khả năng phục vụ cho các ngôn ngữ khác tiếng Anh th́ kém xa
khả năng trong tiếng Anh.
Mà khác biệt
đến một trời một vực này giữa ứng dụng tiếng Anh và ngôn ngữ nào
khác, th́ không chỉ với ChatGPT, đây là t́nh trạng chung cho
mọi ứng dụng AI (artificial intelligence – trí tuệ nhân tạo).
T́nh trạng
như thế kéo dài làm nổi cộm lên vấn đề này: Sự thiệt tḥi của
người không biết tiếng Anh. Và gần gũi hơn, thiết thân hơn, là vấn
đề:
Sự
thiệt tḥi của người chỉ biết tiếng Việt.
Tất nhiên,
thiệt tḥi đó không phải đến bây giờ mới có, hay
mới được
phát hiện, mà xưa nay
vẫn có và được cảm nhận ít nhiều trong giới người Việt có quan tâm
hay có giao tiếp với hải ngoại.
Ngày nay,
AI hiện diện trong phần lớn các hoạt động công nghiệp, doanh
nghiệp, và ngay cả trong sinh hoạt thường nhật của người tiêu
dùng, dần dần nắm một vai tṛ chủ đạo trong cuộc cách mạng kỹ
nghệ lần thứ ba đang tiến hành với trung tâm là năng lượng
tái tạo, công nghệ IT và mạng lưới nối mọi thứ (IOT - Internet of
Things).
Trong bối
cảnh như thế, thiệt tḥi của người chỉ biết tiếng Việt nổi bật
lên, đ̣i hỏi sự quan tâm đúng mức và thảo luận nghiêm túc, hướng
đến một đối sách hữu hiệu và khả thi.
Và yêu cầu
ấy càng ngày càng cấp bách thêm, theo với mức độ phổ cập càng ngày
càng rộng lớn và nhanh chóng của AI.
*
Thiệt tḥi về ngôn ngữ trong bối
cảnh toàn cầu hóa và trí tuệ nhân tạo hiện tại của thế giới là
điều quan trọng cực độ nếu nhận thức rằng:
Ngôn ngữ giữ vai tṛ quan trọng bậc
nhất trong tŕnh độ văn minh của cộng đồng.
Điều dễ nhận
thấy là: ngôn ngữ và văn minh song hành và tương trợ nhau.
Văn minh tiến lên th́ ngôn ngữ giàu thêm nhiều thuật ngữ mới; và
ngôn ngữ giàu thêm cho kịp thời đại lại thúc đẩy văn minh tiến
lên. Cứ thế mà h́nh thành một ṿng tṛn tích cực để phát triển và
tiến bộ.
Bởi văn
minh là kết quả của sự tích lũy (cả trong thời gian, qua các
thời đại, và không gian, qua các địa phương) những thành quả đă
đạt được từ tiến bộ khoa học kỹ thuật (cả tự nhiên và nhân văn),
mà những thành quả này là từ suy nghĩ của con người.
Con người
suy nghĩ bằng ngôn ngữ,
một khi vượt qua thời kỳ thơ ấu chưa biết nói. Và ở tŕnh độ cao
hơn th́ con người suy nghĩ bằng chữ viết, khi đă đọc nhiều
văn kiện, sách báo, và nhất là hiểu biết, ghi nhớ bằng chữ những
khái niệm trừu tượng và có nội hàm bao quát.
Người sống
song ngữ hay đa ngữ hiểu rằng khi nói tiếng Anh th́ ḿnh suy nghĩ
bằng tiếng Anh, mà khi nói tiếng Việt th́ suy nghĩ bằng tiếng
Việt,... một cách tự nhiên và nhanh chóng hơn là phải phiên dịch
qua lại hai thứ ngôn ngữ ấy.
Nếu ngữ vựng
không có đủ thuật ngữ cho kịp với tŕnh độ văn minh cao nhất trên
thế giới hiện tại, th́ người ta không thể có tư duy sáng tạo về
khoa học kỹ thuật được. Có nghĩa là tŕnh độ văn minh của dân tộc
dựa vào ngôn ngữ đó không thể tiến theo kịp với thời đại.
Có thể nói
rằng văn minh được xây dựng trên nền tảng là ngôn ngữ.
Và cũng có
thể mạnh dạn mà suy đoán rằng ngôn ngữ đă có trước văn minh, lịch
sử của ngôn ngữ lâu dài hơn lịch sử văn minh. Thử tưởng tượng xem
từ ban sơ, con người sống đơn độc, tự do hoàn toàn và hoàn toàn
không có khái niệm về tự do. Nhưng khi bắt đầu sống chung đụng với
người khác th́ tự nhiên nảy sinh nhu cầu truyền đạt ư chí, từ đó
phát sinh ra ngôn ngữ, trước hết là tiếng nói, và khá lâu về sau,
là chữ viết.
Chỉ từ
khi có chữ viết th́ mới có công cụ để tích lũy,
cả trong thời gian tức là qua các thời kỳ tiếp nối, và không gian,
qua nhiều địa phương trong cùng thời kỳ. Trên nền tảng dần cao hơn
và vững chắc hơn, con người phát kiến và phát minh càng ngày càng
nhiều, giúp xă hội con người càng phát triển - tiến bộ, làm nảy
sinh ra khái niệm gọi là văn minh, tức là tŕnh độ phát triển
trong sinh
hoạt của các
cộng đồng nhân loại.
Văn minh là
kết quả của sự tích lũy ấy.
Và nền tảng
của văn minh là ngôn ngữ.
Phạm Vũ Thịnh
Sydney, 09/03/2023
®
"Khi phát hành lại thông tin
từ trang này cần phải có sự đồng
ư của tác giả
và ghi rơ nguồn lấy từ www.erct.com"
Cảm tưởng, ư kiến xin gởi về
t4phamvu@hotmail.com
|