Apple Releases Open Source AI Models That Run On-Device - MacRumors

Apple Releases Open Source AI Models That Run On-Device – MacRumors

Bugün Apple, bulut sunucuları üzerinden değil cihazda çalışması için tasarlanmış çeşitli açık kaynaklı büyük dil modelleri (LLM) yayınladı. OpenELM (Open-source Efficient Language Models) olarak adlandırılan LLM’ler, AI kodlarını paylaşma topluluğu olan Hugging Face Hub üzerinde mevcuttur.
Beyaz bir belgede açıklandığı gibi, toplam sekiz OpenELM modeli bulunmaktadır, bunlardan dördü CoreNet kütüphanesini kullanarak önceden eğitilmiş ve dört tanesi de eğitim ayarlı modellerdir. Apple, doğruluk ve verimliliği artırmayı amaçlayan katman kademeli bir ölçekleme stratejisi kullanmaktadır.
Apple kodu, eğitim günlüklerini ve sadece son eğitimli modeli değil, çeşitli sürümleri de sağladı ve projenin arkasındaki araştırmacılar, bu durumun doğal dil AI alanında daha hızlı ilerleme ve “daha güvenilir sonuçlar” elde etmesini ummaktadır.
OpenELM, devrim niteliğinde açık bir dil modelidir. OpenELM, transformator modelinin her katmanında parametreleri etkin bir şekilde tahsis etmek için katman kademeli bir ölçekleme stratejisi kullanır ve bu da doğruluğu artırır. Örneğin, yaklaşık bir milyar parametrelik bir bütçeyle, OpenELM, OLMo’ya kıyasla %2.36 daha yüksek bir doğruluk sergilerken 2 kat daha az ön eğitim belirteci gerektirir.
Model ağırlıklarını ve çıkarım kodunu sağlayan ve özel veri kümeleri üzerinde ön eğitim yapan önceki uygulamalardan saparak, yayınımız, dil modelinin kamuoyunca erişilebilir veri kümelerinde eğitim ve değerlendirilmesi için tam çerçeveyi içermektedir, eğitim günlükleri, çoklu kontroller ve ön eğitim yapılandırmaları da dahil.
Apple, OpenELM modellerini “en son dil modelleri ile açık araştırma topluluğunu güçlendirmek ve zenginleştirmek” amacıyla yayınladığını söylüyor. Açık kaynak modellerini paylaşmak, araştırmacıların riskleri ve veri ve model önyargılarını araştırma imkanı sağlar. Geliştiriciler ve şirketler modelleri olduğu gibi kullanabilir veya değişiklikler yapabilir.
Bilginin açık bir şekilde paylaşılması, Apple’ın en iyi mühendis, bilim adamı ve uzmanları işe almak için önemli bir araç haline gelmiştir, çünkü bu, Apple’ın gizemli politikaları altında genellikle yayımlanamayacak araştırma makaleleri için fırsatlar sunar.
Apple henüz bu tür AI yeteneklerini cihazlarına getirmedi, ancak iOS 18’in bir dizi yeni AI özelliği içereceği ve söylentilere göre Apple’ın gizlilik amaçları için büyük dil modellerini cihazda çalıştırmayı planladığı beklenmektedir.