การทดสอบทัวริงถูกสร้างขึ้นในช่วงปลายยุค 40 ของศตวรรษที่ผ่านมา นักคณิตศาสตร์ชาวอังกฤษ Alan Matheson Turing พยายามทำความเข้าใจว่าหุ่นยนต์สามารถคิดได้หรือไม่ นี่คือสิ่งที่กระตุ้นให้เขาคิดค้น
ประวัติความเป็นมาของการสร้างการทดสอบทัวริง
นักคณิตศาสตร์ชาวอังกฤษ Alan Matheson Turing เป็นที่รู้จักในฐานะผู้เชี่ยวชาญเฉพาะทางด้านวิทยาการคอมพิวเตอร์ คอมพิวเตอร์ และการเข้ารหัส เขาเป็นคนที่สร้างต้นแบบของคอมพิวเตอร์สมัยใหม่ (คอมพิวเตอร์ทัวริง) นักวิทยาศาสตร์มีความสำเร็จอื่น ๆ อีกมากมาย ในช่วงปลายยุค 40 ของศตวรรษที่ผ่านมา นักคณิตศาสตร์เริ่มสงสัยว่าความฉลาดทางอิเล็กทรอนิกส์แบบใดที่ถือว่าสมเหตุสมผล และหุ่นยนต์สามารถเข้าใกล้พฤติกรรมของมนุษย์ได้มากจนคู่สนทนาไม่เข้าใจว่าใครอยู่ตรงหน้าเขาจริงๆ
แนวคิดในการทำแป้งโดว์เกิดขึ้นหลังจากเกมเลียนแบบได้รับความนิยมในอังกฤษ ความสนุกสนานและทันสมัยในช่วงเวลานั้นเกี่ยวข้องกับการมีส่วนร่วมของผู้เล่น 3 คน - ชายหญิงและผู้พิพากษาในบทบาทของบุคคลทุกเพศทุกวัย ชายและหญิงไปที่ห้องแยกกันและยื่นจดหมายให้ผู้พิพากษา ตามรูปแบบการเขียนและลักษณะอื่น ๆ ผู้ตัดสินควรเข้าใจว่าโน้ตใดเป็นของผู้เล่นเพศใดเพศหนึ่ง Alan Turing ตัดสินใจว่าผู้เข้าร่วมคนหนึ่งสามารถถูกแทนที่ด้วยเครื่องจักรอิเล็กทรอนิกส์ หากในกระบวนการสื่อสารทางไกลแบบอิเล็กทรอนิกส์ ผู้ทดลองไม่สามารถระบุได้ว่าคู่สนทนาคนใดเป็นบุคคลจริงและใครเป็นหุ่นยนต์ ถือว่าการทดสอบผ่าน และนี่ควรเป็นเหตุผลในการรับรู้ปัญญาประดิษฐ์
ทำแบบทดสอบ
ในปี 1950 Alan Turing ได้กำหนดระบบคำถามที่สามารถโน้มน้าวใจผู้คนว่าเครื่องจักรสามารถคิดได้
เมื่อเวลาผ่านไป การทดสอบได้รับการปรับปรุงให้ทันสมัย ไม่ใช่เครื่องจักร แต่บอทคอมพิวเตอร์เริ่มทำหน้าที่เป็นเป้าหมายของการทดสอบบ่อยขึ้น ในระหว่างการทดสอบทั้งหมด มีเพียงไม่กี่โปรแกรมเท่านั้นที่ผ่านการทดสอบ แต่ผู้เชี่ยวชาญบางคนตั้งคำถามกับความสำเร็จนี้ คำตอบที่ถูกต้องสามารถอธิบายได้โดยบังเอิญ และแม้แต่ในกรณีที่ดีที่สุด โปรแกรมก็สามารถตอบคำถามได้ไม่เกิน 60% มันเป็นไปไม่ได้ที่จะบรรลุความบังเอิญอย่างสมบูรณ์
หนึ่งในโปรแกรมที่ผ่านการทดสอบทัวริงได้สำเร็จคือเอลิซ่า ผู้สร้างได้มอบปัญญาประดิษฐ์ที่มีความสามารถในการดึงคำหลักจากคำพูดของบุคคลและเขียนคำถามตอบโต้ ในครึ่งกรณี ผู้คนไม่สามารถรับรู้ได้ว่าพวกเขากำลังสื่อสารกับเครื่อง ไม่ใช่กับคู่สนทนาที่ถ่ายทอดสด ผู้เชี่ยวชาญบางคนตั้งคำถามกับผลการทดสอบเนื่องจากผู้จัดงานตั้งค่าหัวข้อไว้ล่วงหน้าสำหรับการสื่อสารสด และผู้เข้าร่วมในการทดลองไม่ได้ตระหนักว่าหุ่นยนต์สามารถให้คำตอบและถามคำถามได้
ความสำเร็จสามารถเรียกได้ว่าผ่านการทดสอบโดยโปรแกรมที่รวบรวมโดยพลเมืองโอเดสซา Yevgeny Gustman และวิศวกรชาวรัสเซีย Vladimir Veselov เธอเลียนแบบบุคลิกของเด็กชายเมื่ออายุ 13 ปี เมื่อวันที่ 7 มิถุนายน 2557 ได้ทำการทดสอบ มีบอท 5 ตัวและคนจริง 30 คนเข้าร่วม คณะลูกขุนเพียง 33 คนจาก 100 คนเท่านั้นที่สามารถระบุได้ว่าหุ่นยนต์ให้คำตอบใด และคำตอบใดคือคำตอบจากคนจริง ความสำเร็จดังกล่าวสามารถอธิบายได้ไม่เพียงแค่โปรแกรมที่ออกแบบมาอย่างดีเท่านั้น แต่ยังรวมถึงข้อเท็จจริงที่ว่าสติปัญญาของวัยรุ่นอายุสิบสามปียังต่ำกว่าผู้ใหญ่อยู่บ้าง บางทีคณะลูกขุนบางคนอาจถูกเข้าใจผิดโดยสถานการณ์นี้
ฝ่ายตรงข้ามของการรับรู้ผลลัพธ์ยังได้รับการสนับสนุนจากข้อเท็จจริงที่ว่า Zhenya Gustman ผู้สร้างโปรแกรมเขียนเป็นภาษาอังกฤษ ในระหว่างการทดสอบ ผู้ตัดสินหลายคนมองว่าการตอบสนองแปลกๆ ของเครื่องหรือหลีกเลี่ยงคำตอบไม่เพียงแต่กับอายุของคู่สนทนาที่ตั้งใจไว้เท่านั้น แต่ยังรวมถึงอุปสรรคทางภาษาด้วย พวกเขาคิดว่าหุ่นยนต์ที่พวกเขาเอามาเป็นมนุษย์นั้นไม่รู้จักภาษาดีพอ
นับตั้งแต่การสร้างการทดสอบทัวริง โปรแกรมต่อไปนี้ก็ใกล้จะผ่านพ้นไปด้วยดีเช่นกัน:
- "สีน้ำเงินเข้ม";
- "วัตสัน";
- "ปัดป้อง".
รางวัลโลบเนอร์
เมื่อสร้างโปรแกรมและหุ่นยนต์สมัยใหม่ ผู้เชี่ยวชาญไม่ถือว่าผ่านการทดสอบทัวริงเป็นงานสำคัญยิ่ง นี่เป็นเพียงพิธีการ ความสำเร็จของการพัฒนาใหม่ไม่ได้ขึ้นอยู่กับผลการทดสอบ สิ่งที่สำคัญที่สุดคือให้โปรแกรมมีประโยชน์ในการทำงานบางอย่าง แต่ในปี 1991 Lebner Prize ได้ก่อตั้งขึ้น ภายในกรอบการทำงาน ปัญญาประดิษฐ์จะแข่งขันกันเองเพื่อให้ผ่านการทดสอบได้สำเร็จ เหรียญมี 3 ประเภท คือ
- ทอง (การสื่อสารด้วยองค์ประกอบวิดีโอและเสียง);
- เงิน (สำหรับการโต้ตอบข้อความ);
- บรอนซ์ (ได้รับรางวัลรถยนต์ที่ประสบความสำเร็จสูงสุดในปีนี้)
เหรียญทองและเงินยังไม่มีใครได้รับรางวัล มีการมอบรางวัลบรอนซ์เป็นประจำ เมื่อเร็ว ๆ นี้มีแอปพลิเคชั่นเข้าร่วมการแข่งขันมากขึ้นเรื่อย ๆ เนื่องจากมีการสร้างผู้ส่งสารและแชทบอทใหม่ การแข่งขันมีผู้วิจารณ์มากมาย ภาพรวมอย่างรวดเร็วของโปรโตคอลผู้เข้าร่วมในช่วงทศวรรษที่ผ่านมาแสดงให้เห็นว่าเครื่องสามารถตรวจพบได้ง่ายโดยมีคำถามที่ซับซ้อนน้อยกว่า ผู้เล่นที่ประสบความสำเร็จมากที่สุดยังกล่าวถึงความยากลำบากของการแข่งขัน Lebner เนื่องจากไม่มีโปรแกรมคอมพิวเตอร์ที่สามารถสนทนาได้ดีเป็นเวลาห้านาที เป็นที่ยอมรับกันโดยทั่วไปว่าแอปพลิเคชันการแข่งขันได้รับการพัฒนาขึ้นเพื่อวัตถุประสงค์ในการรับรางวัลเล็ก ๆ ที่มอบให้กับผู้เข้าร่วมที่ดีที่สุดของปีเท่านั้นและไม่ได้ออกแบบมาสำหรับมากกว่านี้
ปัจจุบันการทดสอบทัวริงได้รับการดัดแปลงที่ทันสมัยหลายประการ:
- การทดสอบทัวริงย้อนกลับ (คุณต้องป้อนรหัสความปลอดภัยเพื่อยืนยันว่าผู้ใช้เป็นมนุษย์ ไม่ใช่หุ่นยนต์)
- การทดสอบทางปัญญาขั้นต่ำ (ใช้เฉพาะตัวเลือก "ใช่" และ "ไม่ใช่" เป็นคำตอบ)
- การทดสอบเมตาทัวริง
ข้อเสียของการทดสอบ
ข้อเสียเปรียบหลักประการหนึ่งของการทดสอบคือโปรแกรมได้รับมอบหมายให้หลอกลวงบุคคล ทำให้เขาสับสนเพื่อให้เขาเชื่อในการสื่อสารกับคู่สนทนาที่แท้จริง ปรากฎว่าผู้ที่รู้วิธีจัดการสามารถรับรู้ได้ว่าเป็นความคิดและสิ่งนี้สามารถถูกตั้งคำถามได้ ในชีวิตทุกอย่างเกิดขึ้นแตกต่างกันเล็กน้อย ตามทฤษฎีแล้ว หุ่นยนต์ที่ดีควรเลียนแบบการกระทำของมนุษย์ให้ถูกต้องที่สุด และไม่สร้างความสับสนให้คู่สนทนา โปรแกรมที่ออกแบบมาโดยเฉพาะสำหรับการผ่านการทดสอบหลีกเลี่ยงคำตอบในสถานที่ที่เหมาะสม อ้างถึงความไม่รู้ เครื่องจักรได้รับการตั้งโปรแกรมเพื่อให้การโต้ตอบดูเป็นธรรมชาติมากที่สุด
นักวิทยาศาสตร์หลายคนเชื่อว่าอันที่จริงแล้ว การทดสอบทัวริงประเมินความคล้ายคลึงของพฤติกรรมการพูดระหว่างมนุษย์กับหุ่นยนต์ แต่ไม่ใช่ความสามารถของปัญญาประดิษฐ์ในการคิด ตามที่ผู้สร้างระบุไว้ ผู้คลางแคลงอ้างว่าการปฐมนิเทศต่อการทดสอบดังกล่าวทำให้ความคืบหน้าช้าลงและป้องกันไม่ให้วิทยาศาสตร์ก้าวไปข้างหน้า ในศตวรรษที่ผ่านมา การผ่านการทดสอบถือเป็นความสำเร็จที่ยิ่งใหญ่และแม้กระทั่งบางสิ่งที่น่าอัศจรรย์ แต่ในปัจจุบัน ความสามารถของคอมพิวเตอร์ในการ "ตอบสนองเหมือนบุคคล" ไม่อาจเรียกได้ว่าเหนือธรรมชาติ