Ana Sayfa Teknoloji ‘Çilek’ sorunu: Yapay zekanın sınırlamalarının üstesinden nasıl gelinir?

Teknoloji

‘Çilek’ sorunu: Yapay zekanın sınırlamalarının üstesinden nasıl gelinir?

Yazar

12 Ekim 2024

Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin

Şimdiye kadar büyük dil modelleri (Yüksek Lisans’lar) ChatGPT ve Claude gibi dünya çapında gündelik bir kelime haline geldi. Birçok insan bundan endişelenmeye başladı Yapay zeka işleri için geliyorBu nedenle hemen hemen tüm Yüksek Lisans tabanlı sistemlerin basit bir görevde bocaladığını görmek ironiktir: “Çilek” kelimesindeki “r” sayısını saymak. Yalnızca “r” alfabesinde başarısız olmuyorlar; diğer örnekler arasında “memeli”deki “m”lerin ve “su aygırı”ndaki “p”lerin sayılması yer alır. Bu makalede bu başarısızlıkların nedenini açıklayacağım ve basit bir geçici çözüm sunacağım.

Yüksek Lisanslar, insan benzeri bir dili anlamak ve oluşturmak için çok miktarda metin üzerinde eğitilmiş güçlü yapay zeka sistemleridir. Soruları yanıtlamak, dilleri tercüme etmek, içeriği özetlemek ve hatta aldıkları girdilere göre tutarlı yanıtları tahmin edip oluşturarak yaratıcı yazılar üretmek gibi görevlerde çok başarılılar. Yüksek Lisans’lar metindeki kalıpları tanıyacak şekilde tasarlanmıştır; bu da onların dille ilgili çok çeşitli görevleri etkileyici bir doğrulukla yerine getirmelerine olanak tanır.

Tüm hünerlerine rağmen “çilek” kelimesindeki “r” sayısını sayamamak, yüksek lisans öğrencilerinin insanlar gibi “düşünme” yeteneğine sahip olmadıklarını hatırlatıyor. Onlara beslediğimiz bilgileri bir insan gibi işlemezler.

*ChatGPT ve Claude ile çilekteki “r” sayısı hakkında sohbet.*

Mevcut yüksek performanslı LLM’lerin neredeyse tamamı temel alınarak oluşturulmuştur. transformatörler. Bu derin öğrenme mimarisi, metni girdi olarak doğrudan almaz. Adı verilen bir işlemi kullanıyorlar tokenleştirmeMetni sayısal temsillere veya belirteçlere dönüştüren. Bazı belirteçler tam kelimeler olabilir (“maymun” gibi), bazıları ise bir kelimenin parçaları olabilir (“mon” ve “anahtar” gibi). Her jeton, modelin anladığı bir kod gibidir. Her şeyi jetonlara bölerek mannequin, bir cümledeki sonraki jetonu daha iyi tahmin edebilir.

Yüksek Lisans’lar kelimeleri ezberlemez; bu jetonların farklı şekillerde nasıl bir araya geldiğini anlamaya çalışıyorlar, bu da onları daha sonra ne olacağını tahmin etmede başarılı kılıyor. “Su aygırı” kelimesi durumunda, mannequin “hip”, “pop”, “o” ve “tamus” harflerinin simgelerini görebilir ve “su aygırı” kelimesinin şu harflerden oluştuğunu bilmeyebilir: ” h”, “i”, “p”, “p”, “o”, “p”, “o”, “t”, “a”, “m”, “u”, “s”.

Bireysel harflere onları simgeleştirmeden doğrudan bakabilen bir mannequin mimarisi potansiyel olarak bu sorunu yaşamayabilir, ancak günümüzün transformatör mimarileri için bu, hesaplama açısından mümkün değildir.

Ayrıca, Yüksek Lisans’ların çıktı metnini nasıl oluşturduğuna baktığımızda: tahmin etmek önceki giriş ve çıkış belirteçlerine göre bir sonraki kelimenin ne olacağı. Bu, bağlamsal olarak bilinçli insan benzeri metinler oluşturmak için işe yarasa da, harfleri sayma gibi basit görevler için uygun değildir. “Çilek” kelimesindeki “r” sayısını yanıtlamaları istendiğinde, LLM’ler yalnızca giriş cümlesinin yapısına dayalı olarak cevabı tahmin ediyor.

İşte bir geçici çözüm

Yüksek Lisans öğrencileri “düşünme” veya mantıksal olarak akıl yürütme becerisine sahip olmasa da, yapılandırılmış metni anlama konusunda ustadırlar. Yapılandırılmış metnin muhteşem bir örneği, birçok programlama dilinin bilgisayar kodudur. ChatGPT’den Python’u kullanarak “çilek” sözcüğündeki “r” sayısını saymasını istersek büyük olasılıkla doğru cevabı alacaktır. LLM’lerin sayma veya mantıksal akıl yürütme veya aritmetik hesaplama gerektirebilecek başka bir görev yapmasına ihtiyaç duyulduğunda, daha geniş yazılım, istemlerin LLM’den giriş sorgusunu işlemek için bir programlama dili kullanmasını istemeyi içerecek şekilde tasarlanabilir.

Çözüm

Basit bir harf sayma deneyi, ChatGPT ve Claude gibi Yüksek Lisans’ların temel sınırlamalarını ortaya koyuyor. İnsan benzeri metinler oluşturma, kod yazma ve kendilerine sorulan her soruyu yanıtlama konusundaki etkileyici yeteneklerine rağmen, bu yapay zeka modelleri henüz bir insan gibi “düşünemiyor”. Deney, modellerin ne olduklarını, kalıp eşleştirme tahmin algoritmalarını ve anlama veya akıl yürütme yeteneğine sahip “zeka”yı değil, ne olduklarını gösteriyor. Ancak hangi tür yönlendirmelerin işe yaradığına dair önceden bilgi sahibi olmak, sorunu bir dereceye kadar hafifletebilir. Yapay zekanın hayatımıza entegrasyonu arttıkça, sınırlılıklarının farkına varılması, bu modellerin sorumlu kullanımı ve gerçekçi beklentiler açısından hayati önem taşıyor.

Chinmay Jog, kıdemli bir makine öğrenimi mühendisidir. Pangiam.

Veri Karar Vericileri

VentureBeat topluluğuna hoş geldiniz!

DataDecisionMakers, veri çalışması yapan teknik kişiler de dahil olmak üzere uzmanların veriyle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.

En son fikirleri ve güncel bilgileri, en iyi uygulamaları ve veri ile veri teknolojisinin geleceğini okumak istiyorsanız DataDecisionMakers’ta bize katılın.

Kendi makalenizle katkıda bulunmayı bile düşünebilirsiniz!

DataDecisionMakers’dan Daha Fazlasını Okuyun

Kaynak

‘Çilek’ sorunu: Yapay zekanın sınırlamalarının üstesinden nasıl gelinir?

İşte bir geçici çözüm

Çözüm

CEVAP VER İptal

Son Gönderi

İngiliz yıldız, ‘sezona zorlu bir başlangıç’ yaptıktan sonra Euro 2024’te akşamdan...

Canlı: Süper otomobiller Mount Panorama’daki Bathurst 1000’in ilgi odağında

Wolfs Yıldızı Austin Abrams, George Clooney ve Brad Pitt’le Çalışma Deneyimini...

Rapor: Bayern Münih’in Alisson transferiyle ilgili tutumu açıklandı

Vahşi Robotic Devam Filmiyle Geri Dönecek

Terry Fox Umut Maratonu kampanya yöneticisi Invoice Vigars 78 yaşında hayatını...

Billy Crystal, Lakers Maçında Jack Nicholson’ı Öptüğü Zamanı Hatırlıyor ve Öpüşmeden...

Les Bruins, Kings’in yanında enchaînent yüz

Jenrick, Tory partisi başkanlığına Rees-Mogg’u atayacağını söyledi

Nick Cannon 16 Yaşında Diddy Partisine Katılıyor