Haber

Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki…

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, ileri seviye modellerin genellikle detayları kaçırdığını belirtiyor ve Gemini 3 Flash’ın Agentic Vision sayesinde görüntü anlamını ajansal bir sürece dönüştürdüğünü açıklıyor. Bu yenilikçi model, görüntüleri daha doğru bir şekilde işlemek için görsel kanıtlara dayanıyor. Agentic Vision, görüntü muhakemesini kod yürütme ile birleştirerek kalite artışı sağlıyor. Düşün, Harekete Geç, Gözlemle döngüsünü kullanan model, kullanıcı sorgusunu analiz ederek adımlı planlar oluşturuyor. Ayrıca, Python kodu oluşturup çalıştırarak görüntüleri işleyebiliyor. Yeni yetenek, görüntüdeki detayları algılayarak yakınlaştırma ve görselleştirme gibi işlemleri başarılı bir şekilde gerçekleştirebiliyor. Google, Agentic Vision’ı Gemini uygulamasına entegre etmeye başladı ve geliştiricilere erişim imkanı sunuyor.