Üretken Yapay Zekâ (Generative AI) alanında birçok yeni kavram ortaya çıkıyor; bazıları hızla kaybolurken, bazıları kalıcı oluyor. Büyük Dil Modelleri Özneleri (LLM-Agents) de bu kavramlardan biri ve birçok problemde başarılı olduğu iddia ediliyor. Bu yazıda, bu kavrama daha yakından bakacak, bazı kullanım durumlarını ele alacak ve ne kadar yararlı olduklarını tartışacağız.
Büyük Dil Modelleri ilk çıktığında, etkileyici yetenekleriyle dikkat çekti. Ancak zamanla, halüsinasyonlar, güncel ve doğru bilgiye erişim eksikliği ve karmaşık problemlerde yetersiz performans gibi eksiklikler ortaya çıktı. LLM-Özneleri, bu tür sorunları çözmek için geliştirilen bir çerçevedir. Amaç, karmaşık görevleri yerine getirmek için birlikte çalışan, iyi tanımlanmış küçük ölçekli görevleri olan LLM’leri kullanmaktır.
Özne tabanlı akıl yürütme ve problem çözme bilişsel bilimlerin uzun süredir üzerine çalıştığı bir alan ve LLM- Özneleri çerçeveleri bu literatürden beslenmiştir.1 Her bir özne, kod yorumlayıcısı, web araması, sorgu yapmak ve aksiyon almak için API erişimi gibi çeşitli araçlara erişimi olan, özel olarak tasarlanmış bir LLM’dir. Aşağıdaki diyagramda bir LLM-Öznesinin genel yapısını görüyoruz. “Planlama” kısmı, ajandan yansıtma ve alt hedef ayrıştırma gibi çeşitli muhakeme adımlarını gerçekleştirmesinin istendiği özel istemi (prompt) ifade eder. Problem çözme için gereken birden fazla adımı başarıyla takip etmek için, öznenin sürecin bazı kısımlarını hatırlaması da gerekebilir ve bu yüzden hafızaya ihtiyaç duyar.
Kullanım senaryosuna bağlı olarak, tüm araçlara ve karmaşık bir istem setine erişimi olan tek bir LLM-Öznesi kullanabiliriz veya farklı yeteneklere ve hedeflere sahip birden fazla LLM-Öznesine sahip olabiliriz. Langchain, LlamaIndex, MS AutoGen, CrewAI ve diğer çeşitli araçlar LLM-Öznelerini uygulamak için teknolojik altyapı sağlamaktadır.
Özne tabanlı iş akışlarının en önemli savunucularından birisi Andrew Ng’dir ve çeşitli yaklaşımlar önermiştir. 2LLM-Öznelerinin en çarpıcı kullanım alanı, önemli iyileştirmeler sağladığı kodlama asistanları olarak görülmektedir. 3Kodlama bağlamında, yürütme ve test etme süreçleri otomatize edilebildiği için LLM-Özneleri iyi sonuçlar elde etmektedir. Diğer durumlarda LLM-Özneleri tarafından sunulan büyük bir atılım henüz görmedik, ancak başarılı sonuçlar elde ettiklerini de görüyoruz.
Pratik uygulamalarda, karmaşık iş kısıtları ve hedefleriyle karşılaşıyoruz. Bunlar genellikle istemlerle (prompt) halledilebilse de bu yaklaşım projelerin sürdürülebilirliğini zorlaştırıyor ve uzmanlığın yeni projelere aktarılması külfetli hale geliyor.
KoçDigital’deki deneyimimiz, bir proje LLM-Öznelerinin tam gücünü gerektirmese bile bizi LLM-Öznesi çerçevelerini kullanmaya yöneltti. LLM-Özneleri aracılığıyla bakımı ve yeniden uygulanması kolay olan daha sistematik bir yaklaşımla proje ve ürünlerimizi yapılandırıyoruz.
LLM-Özneleri tarafından sunulan bir diğer fırsat da LLM’nin kendisini eğitmeden LLM’lerle inovasyon yapabilme kabiliyeti. Model düzeyinde yenilik yapmak yüksek yatırım maliyeti gerektiriyor. Bir LLM’i eğitmek çok fazla hesaplama gücü, veri ve uzmanlık gerektirir. Öte yandan LLM-Özneleri, bir alanındaki spesifik bir uzmanlıktan yararlanarak yaratıcı sonuçlar elde etmek için kullanılabilir.
KoçDigital olarak, Generative AI teknolojilerini iş süreçlerinize en kolay, doğru ve güvenli şekilde entegre etmeniz için yanınızdayız. Detaylı bilgi almak ve projelerinizi bir sonraki seviyeye taşımak için bizimle iletişime geçebilirsiniz.
1. https://arxiv.org/pdf/2309.02427v3
2. https://www.deeplearning.ai/the-batch/tag/letters/
3. https://www.youtube.com/watch?v=aA-HVPmjt3c