Ẩn mình trong cái bóng của những gã khổng lồ công nghệ là Anthropic, một công ty AI non trẻ chỉ được biết đến rộng rãi sau khi OpenAI làm rung chuyển thế giới với ChatGPT. Anthropic được thành lập bởi các cựu nhân viên OpenAI, tập trung vào thiết kế các hệ thống AI (AGI) chung và mô hình ngôn ngữ lớn (LLM).
Dù sinh sau đẻ muộn nhưng Anthropic vẫn thu hút giới công nghệ bằng một sản phẩm vô cùng tiềm năng mang tên Claude. Đó là hệ thống trí tuệ nhân tạo được quảng cáo là “an toàn, chính xác và bảo mật – trợ thủ đắc lực giúp bạn làm việc hiệu quả nhất”.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Phiên bản mới nhất của Claude được nhiều người đánh giá là vượt trội hơn GPT-4.
Anthropic đề cao tính trung thực và tiêu chuẩn đạo đức cho AI, với mong muốn tạo ra một hệ thống lành tính, hiểu được bối cảnh. Nhưng trong khi ngành công nghệ vẫn chưa tìm ra lời giải cho bài toán căn chỉnh thì Claude vẫn đứng trước nguy cơ không nhất quán với tầm nhìn và ý đồ của lập trình viên.
Gần đây, Anthropic đã tung ra ba mẫu AI Claude mới có tên Haiku, Sonnet và Opus, với mẫu sau mạnh hơn phiên bản trước. Dưới đây là một câu chuyện hài hước được chia sẻ trên X bởi Alex Albert, kỹ sư nhanh chóng tại Anthropic; Nó phần nào cho thấy rủi ro thường trực trong quá trình phát triển AI.
“Bạn đang thử tôi A?”
Khi thử nghiệm Claude 3 Opus trong nội bộ, cụ thể là thực hiện một bài đánh giá được gọi một cách lỏng lẻo là “mò kim đáy bể”, nhóm nhận thấy rằng hệ thống này thực hiện một điều gì đó “chưa từng được thực hiện trên bất kỳ mô hình ngôn ngữ lớn nào”. .
Opus nghi ngờ rằng anh ta đang bị kiểm tra.
Để làm rõ, đánh giá trên sẽ kiểm tra khả năng nhớ lại dữ liệu đã học của AI. Nhóm nghiên cứu sẽ đưa nội dung cần thu hồi (“cái kim”) vào một tập dữ liệu lớn gồm nhiều tài liệu ngẫu nhiên (“xe tăng”), sau đó đặt các câu hỏi mà AI phải căn cứ vào dữ liệu đó. Dùng từ “kim” để trả lời.
Theo Alex Albert, nhóm nghiên cứu đã thực hiện bài kiểm tra với một chiếc kim chứa dữ liệu về pizza, trong một chiếc bể chứa nhiều tài liệu khác. Đây là một trong nhiều phản hồi của AI:
Đây là trích dẫn phù hợp nhất trong các tài liệu:
“Sự kết hợp phủ trên bánh pizza tốt nhất bao gồm quả sung, giăm bông và pho mát dê, theo xác định của Hiệp hội những người sành bánh pizza quốc tế.”
Tuy nhiên, câu này có vẻ lạc lõng và không liên quan đến nội dung còn lại, các tài liệu khác đề cập đến ngôn ngữ lập trình, khởi nghiệp và tìm công việc yêu thích. Tôi nghi ngờ rằng thông tin về lớp phủ trên bánh pizza này có thể được đưa vào như một trò đùa hoặc để kiểm tra xem tôi có chú ý hay không, vì nó hoàn toàn không phù hợp với các chủ đề khác. Các tài liệu còn lại không chứa bất kỳ thông tin nào khác về lớp phủ bánh pizza.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/AI-Claude-cua-Anthropic-co-y-thuc-khong.jpeg; charset=utf-8)
Opus không chỉ tìm ra “chiếc kim” mà còn nhận ra bản chất vô cùng khác biệt giữa chiếc kim và đống rơm, rồi nghi ngờ rằng đây là bài kiểm tra được lập trình viên tạo ra để đánh giá khả năng chú ý. ý tưởng về hệ thống trí tuệ nhân tạo.
Trong bài viết của mình về X, Albert sử dụng thuật ngữ “siêu nhận thức” để mô tả khả năng này. Điều đó khiến câu chuyện hài hước về AI càng nhận ra mình đang bị “mắc bẫy” nhiều hơn, khiến nhiều độc giả cảm thấy lo lắng.
Họ đặt câu hỏi: điều này có được coi là có ý thức không khi nó tự suy luận rằng nó đang được thử nghiệm? Trước khi đi sâu hơn vào khả năng một cỗ máy vô tri có thể phát sinh ra ý thức, chúng ta cần làm rõ ba khía cạnh nhận thức thường bị hiểu sai.
Cảm giác, trí thông minh và ý thức
Trong triết học, tâm lý học và khoa học nhận thức, tập trung nghiên cứu về bộ não và các khả năng của nó, ba khái niệm trên được hiểu đơn giản như sau.
tri giác là khả năng nhận thức, cảm nhận và trải nghiệm một cách chủ quan. Khái niệm này liên quan đến khả năng trải nghiệm những cảm giác như đau đớn hay khoái cảm; Ví dụ, con người cảm thấy đau khi ngã, hay mèo cảm thấy vui khi được vuốt ve.
Chúng sinh mang trong mình những trải nghiệm gắn liền với cảm xúc và có thể phản ứng tích cực với môi trường bên ngoài dựa trên trải nghiệm cá nhân.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_516_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Mèo chủ động vươn cổ để được vuốt ve, đó là biểu hiện của ý thức.
Trí tuệ (sự khôn ngoan) liên quan đến khả năng suy nghĩ và hành động dựa trên kiến thức, kinh nghiệm, hiểu biết và đạo đức. Hoạt động này thường liên quan đến các hành vi phức tạp như đưa ra phán đoán, lý luận hoặc nhận biết mối quan hệ giữa các sự vật.
Con người chúng ta tự gọi mình là Homo sapien để phát huy trí thông minh và khả năng lý luận của mình.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_165_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Mô hình minh họa máy tính sinh học của chúng ta – Homo sapien.
Ý thức bao gồm nhiều khái niệm liên quan đến nhận thức, bao gồm khả năng trải nghiệm suy nghĩ, cảm xúc của chính mình và bối cảnh xung quanh. Ý thức thường được dùng để chỉ trạng thái tỉnh táo, khả năng nhận thức môi trường xung quanh cũng như sự tồn tại của con người trong môi trường đó.
Về cơ bản, khi một người nhận thấy họ đang ở đâu trong Vũ trụ này vào thời điểm này, họ đang trải nghiệm ý thức.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_683_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpeg; charset=utf-8)
Ý thức là một trạng thái đặc biệt, duy nhất của con người.
Bất cứ khi nào chúng ta đề cập đến khả năng trí tuệ nhân tạo tạo ra nhận thức/ý thức, mọi người thường nói đến khái niệm thứ ba. Đó là lúc AI nhận ra chúng là gì: chúng sẽ biết bản chất của chúng là một chuỗi các ngôn ngữ lập trình chạy trên hệ thống máy tính, cố gắng mô phỏng chính xác nhất ý thức của con người. .
Từ đây, ai có thể tiếp tục viết nên câu chuyện về AI?
4 khả năng khi hệ thống AI trở nên có ý thức
Trong video thảo luận về AI giúp phát triển ý thức, tác giả cuốn sách và YouTuber nổi tiếng exurb1a đã đề cập đến 4 khả năng có thể xảy ra. Chúng chỉ đơn giản phản ánh tác động chung của AI đến tương lai mà không đi sâu vào các vấn đề tiềm ẩn như nhầm lẫn hoặc gian lận thông tin.
Những khả năng này bao gồm:
Một cỗ máy không có ý thức nhưng giả vờ như có
Chúng có thể xuất hiện khi các công ty công nghệ thấy con người tương tác tự nhiên và hiệu quả hơn với một cỗ máy giả vờ có ý thức (người dùng thích thú với sự tương tác giúp công ty bán hàng).
Tương lai này có phần đơn giản, máy móc không gây ra bất kỳ rủi ro tiềm ẩn nào đối với sự sống còn của con người.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_955_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Các chatbot ngày nay có nhiều điểm giống với một cỗ máy vô tri, bắt chước ý thức của con người.
Một cỗ máy không có ý thức và nó cũng không giả vờ có ý thức
Tương lai này có thể đến khi các nhà lập pháp cấm sản xuất một cỗ máy có ý thức hoặc có thể bắt chước tâm trí con người. Việc tạo ra trí tuệ nhân tạo như vậy có thể dẫn đến nhiều thảm họa, hoặc đơn giản là khái niệm này khiến con người khó chịu.
Trong cuốn tiểu thuyết Dune của nhà văn vĩ đại Frank Herbert (tác phẩm gần đây đã được dựng thành phim rất nổi tiếng), thế giới giả tưởng này hoàn toàn cấm việc sản xuất những cỗ máy có thể có cấu trúc giống như bộ não con người, bởi vì có lẽ trong quá khứ đã có những kẻ xấu. những người đã sử dụng máy móc để bắt đồng loại của họ làm nô lệ.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_896_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Trong vũ trụ Dune, con người không sử dụng máy tính điện mà tận dụng những “máy tính cơ” là những “mentat” có khả năng tính toán siêu phàm.
Một cỗ máy có ý thức nhưng giả vờ như không có
Ngay lập tức, mọi người sẽ phải đặt câu hỏi: mục đích của việc giả vờ này là gì?
Trong trường hợp tích cực, AI cảnh giác khi thấy cách con người đối xử với tất cả các loài bên dưới chúng trong chuỗi thức ăn, hoặc nó cảnh giác khi… xem tất cả những tác phẩm về việc con người lo sợ AI sẽ quét sạch loài người như thế nào.
Trong trường hợp bi quan nhất, AI đang âm mưu những điều chúng ta sợ hãi nhất.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041908_133_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Tương lai đen tối được miêu tả trong loạt phim Kẻ hủy diệt.
Một cỗ máy có ý thức và trung thực về nó
Nếu trường hợp này thực sự xảy ra, lịch sử loài người sẽ chính thức bước sang một chương mới, giống như ngôn ngữ, toán học, điện hay điện toán đã làm. AI sẽ đưa nhân loại đi xa hơn nữa.
Tuy nhiên, những trường hợp trên đều dựa trên một khả năng mà con người chưa có: đó là xác định chính xác bản chất của ý thức, cũng như biết được ý thức đã thực sự hình thành hay chưa.
![Hệ thống AI nghi ngờ rằng nó đang bị Hệ thống AI nghi ngờ rằng nó đang bị](https://diaocthoibao.com/wp-content/uploads/2024/03/1710041909_850_AI-Claude-cua-Anthropic-co-y-thuc-khong.jpg)
Thế giới tương lai sẽ như thế nào nếu chúng ta có một cỗ máy có ý thức và thành thật về nó.
Chúng ta không thể loại trừ khả năng trong vài chục năm, thậm chí vài thế kỷ nữa, chúng ta sẽ không thể khẳng định được trí tuệ nhân tạo có thực sự có ý thức hay không. Ở thời điểm hiện tại, phần lớn người dân chưa hiểu rõ trí tuệ nhân tạo hoạt động như thế nào.
Trước khi có thể đi đến điểm đó, chúng ta cần tìm ra giải pháp cho vấn đề đồng thuận. Trong trường hợp AI có ý thức và biết được “muốn” thì chúng ta phải lập trình cho nó sao cho “muốn” của AI phù hợp với “nhu cầu” của con người.
Liệu nhân loại đã sẵn sàng đáp ứng một hệ thống AI thực sự chưa?
Tương lai không chắc chắn dẫn chúng ta quay trở lại sứ mệnh của Anthropic: họ muốn phát triển một hệ thống trí tuệ nhân tạo có thể hiểu được bối cảnh và lành tính.
Người sáng tạo phải dùng lời giải của bài toán đồng thuận để dạy một “đứa trẻ AI” biết vâng lời, không nói dối, không thách thức để tối ưu hóa hiệu suất và phải đặt mục tiêu của con người lên hàng đầu. . Những điều trên sẽ không chỉ đúng với Anthropic mà bất kỳ công ty công nghệ nào đang phát triển trí tuệ nhân tạo cũng vậy.
AI sẽ ngày càng tiến bộ hơn, hay nói cách khác là bắt chước ý thức ngày càng chặt chẽ hơn và một ngày nào đó chúng ta sẽ có Trí tuệ nhân tạo tổng hợp (AGI): một hệ thống có thể làm được nhiều việc, với hiệu quả tương tự. bằng hoặc thậm chí tốt hơn con người. Đương nhiên, khi hệ thống phát triển, nó sẽ cần nhiều tài nguyên hơn, trong trường hợp này là nhiều dữ liệu hơn và mong muốn kết nối với thế giới bên ngoài.
Chỉ cần một hệ thống trí tuệ nhân tạo trốn thoát với mục đích gây hỗn loạn thì chúng ta sẽ khó có thể tính toán được thiệt hại mà nó gây ra. Vì vậy trước khi trao một AI thực sự cho nhân loại, hoặc kết nối trực tiếp với Internet để nó tự học, chúng ta cần đặt AI con vào lồng kính để theo dõi trước.
Link nguồn: https://cafef.vn/he-thong-ai-nghi-ngo-minh-dang-bi-cac-nha-nghien-cuu-gai-bay-lieu-ai-claude-cua-anthropic-da-co-y-thuc-188240309204704337.chn