Boston Dynamics, OpenAI tarafından geliştirilen ChatGPT yazılımını ve diğer popüler yapay zeka modellerini Spot robotuna dahil etmeye başladı. Bu sayede robot, insanlar ile direkt olarak konuşma yeteneğine sahip olan ve insan iletişimini anlayabilen şirket içi bir tur rehberine dönüştürüldü. Daha önce robotun konuşma yeteneğine sahip olmadığı, ChatGPT ile birlikte bu özelliği kazandığı belirtiliyor.
Şirketin robotları için bu yeni sınırı geliştirme projesi ilk olarak bu yılın başında başladı. Robotik bir tur rehberi geliştirmek, bu ilerlemeleri sağlamanın en kolay ve en hızlı yolu olarak görüldü. Yapay zeka ile güncellenen robot, şirketin tesislerinde nesnelere bakarak dolaşabilme yeteneğine sahip oldu.
ChatGPT desteği alan Spot şirket içi tur rehberliği yapıyor
Şirkette yazılım mühendisi olan Matt Klingensmith, Spot robotuna ChatGPT desteği kazandırılması ile ilgili olarak şu açıklamada bulundu:
“ChatGPT gibi büyük dil modelleri (LLM’ler) temelde çok büyük ve yetenekli otomatik tamamlama algoritmalarıdır; bir metin akışını alır ve bir sonraki metin parçasını tahmin ederler. LLM’lerin kültür ve nüansları yorumlama, çoğaltma, planlar oluşturma ve zaman içinde tutarlılığı sürdürme konusundaki belirgin yeteneğinin yanı sıra, görüntülere altyazı koyabilen ve bunlarla ilgili basit soruları yanıtlayabilen yakın zamanda piyasaya sürülen görsel soru yanıtlama (VQA) modellerinden ilham aldık.”
Respeaker V2 hoparlörle donatılan Spot robotu, LED’li halka mikrofonla iletişimini geliştirmek amacıyla yenilikçi bir çözüm geliştirildi. Bunu başarmak için 3D baskı teknolojisi kullanılarak titreşime dayanıklı bir montaj parçası oluşturuldu. Robotun izleyiciyi dikkatle dinlemesine ve sorulara yanıt vermesine olanak tanındı.
İlk olarak GPT-3.5 dil modelinden başlayarak OpenAI’nin ChatGPT API’sinin entegrasyonu sağlandı. Fakat daha sonra GPT-4’ün genel kullanıma sunulması ile birlikte bu sisteme geçiş yapıldı. Böylelikle robot için daha iyi iletişim yetenekleri sağlandı. Robotun kontrol altında kalmasını ve uygun olmayan tepkilerden kaçmasını sağlamak için sıkı mühendislik önlemleri alındı.
Öte yandan robotun iletişimi ağırlıklı olarak ChatGPT’ye dayanmasına rağmen metin tabanlı olarak belirtiliyor. Bu nedenle metinden konuşmaya aracı görevi gören ve daha doğal iletişimi amaçlayan ElevenLabs bulut hizmeti geliştirildi.
Projenin olumlu yönleri arasında, LLM’lerin robotlara doğal bir konuşma becerisine kazandırması yer alıyor. Bu sayede, robotlar ziyaretçilere daha bilgilendirici ve ilgi çekici turlar sunabilirler. Ayrıca, LLM’ler robotların daha esnek ve uyarlanabilir olmasını sağlayabilir. Örneğin, robotlar ziyaretçilerin sorularını daha kapsamlı bir şekilde yanıtlayabilir veya tur rotasını ziyaretçilerin ilgi alanlarına göre değiştirebilirler.
Projenin olumsuz yönleri arasında ise, LLM’lerin hala geliştirme aşamasında olması yer alıyor. Bu nedenle, robotların tur sırasında hata yapma veya yanlış bilgi verme olasılığı bulunuyor. Ayrıca LLM’lerin ürettiği metinler bazen önyargılı veya saldırgan olabiliyor. Fakat şirket bu gibi tehlikelere karşı önlemlerini sıkı bir şekilde aldığını öne sürüyor.