Apple'ın yapay zekasını geliştirme konusundaki kararlılığı, yapay zeka modellerinin eğitilmesine yönelik yaklaşımı kökten değiştirebilecek bir stratejiyle şekilleniyor. Apple Intelligence'ı hibrit bir yöntem kullanarak geliştirmesine olanak tanıyan yenilikçi bir sistemi duyurdu. Laboratuvarda oluşturulan sentetik veriler gerçek kullanıcıların e-postalarıyla karşılaştırılıyor, ancak tüm bunlar doğrudan kişisel cihazlarda gerçekleşiyor ve hiçbir özel bilgi iPhone veya Mac'ten çıkmıyor. Bu metodoloji, yapay zekanın temel ikilemlerinden biri olan kullanıcı gizliliğini tehlikeye atmadan doğru ve doğal modeller elde etme sorununu çözmeye yönelik bir girişimi temsil ediyor.
Apple'ın yapay zeka eğitimine yönelik geleneksel yaklaşımı, esas olarak sentetik verilere dayanıyordu, yani kullanıcıların kişisel bilgilerinin kullanılmasını önlemek için yapay olarak oluşturulan içeriklere, bu tercihin önemli sınırlamaları da var. Yapay veriler, ne kadar karmaşık olursa olsun, özellikle e-posta iletişimleri gibi karmaşık bağlamlarda, gerçek insan dilinin nüanslarını ve özelliklerini yansıtmada zorluk çekiyor.
Apple Machine Learning Research web sitesinde yayınlanan bir raporda ayrıntıları verilen yeni teknik, dolaylı geri bildirim mekanizmasını tanıtıyor. Apple, birçok günlük senaryoyu kapsayan çok sayıda sentetik e-posta mesajı üretiyor. Bu mesajlar metin olarak değil, içeriğin temel özelliklerini gerçek metni korumadan yakalayan matematiksel gösterimler olan yerleştirmeler olarak saklanır.
Sistem daha sonra bu yerleştirmeleri Cihaz Analitiği programına katılmayı kabul eden kullanıcıların cihazlarına gönderir. İşte sihir tam burada gerçekleşiyor. Cihaz, bu şablonları yerel olarak kullanıcının gerçek e-postalarıyla karşılaştırıyor ve hangi yerleştirmelerin cihazdaki gerçek mesajlara en çok benzediğini değerlendiriyor.
Bu karşılaştırmaların sonuçları daha sonra, verilere istatistiksel gürültü ekleyerek verilerin tek bir kullanıcıya kadar izlenmesini imkansız hale getiren farklı gizlilik teknikleri kullanılarak bir araya getirilir. Apple, kullanıcıların gerçek içeriği veya kimlikleri hakkında hiçbir ayrıntıya yer vermeden, yalnızca hangi sentetik şablonların en sık seçildiğine ilişkin bilgi alıyor.
Bu metodoloji, sistemin gerçek iletişimlere giderek daha yakın olacak şekilde sentetik mesajların yeni varyantlarını üretmesine olanak tanır. Örneğin, "Yarın saat 13:30'da futbol oynamak ister misin?" ifadesini temsil eden bir yerleştirme. Sistemin gerçek iletişim durumlarını anlama ve yönetme kapasitesini genişleterek, farklı spor dalları, zaman çizelgeleri veya tekliflerle farklı varyantlara evrilebilir.
Bu yaklaşımı özellikle ilgi çekici kılan şey, Apple'ın yapay zeka performansını iyileştirmek ile gizliliği korumak arasındaki karmaşık dengeyi nasıl sağladığıdır. Şirket, birçok rakibinin yaptığı gibi gerçek dünyadan büyük miktarda veri toplamak yerine, gerçek iletişimlerden dolaylı olarak öğrenen bir sistem geliştirdi ve kullanıcı gizliliğine saygı duyan bir yapay zeka modeline olan bağlılığını sürdürdü.
Apple'ın yapay zeka eğitimine yönelik geleneksel yaklaşımı, esas olarak sentetik verilere dayanıyordu, yani kullanıcıların kişisel bilgilerinin kullanılmasını önlemek için yapay olarak oluşturulan içeriklere, bu tercihin önemli sınırlamaları da var. Yapay veriler, ne kadar karmaşık olursa olsun, özellikle e-posta iletişimleri gibi karmaşık bağlamlarda, gerçek insan dilinin nüanslarını ve özelliklerini yansıtmada zorluk çekiyor.
Apple Machine Learning Research web sitesinde yayınlanan bir raporda ayrıntıları verilen yeni teknik, dolaylı geri bildirim mekanizmasını tanıtıyor. Apple, birçok günlük senaryoyu kapsayan çok sayıda sentetik e-posta mesajı üretiyor. Bu mesajlar metin olarak değil, içeriğin temel özelliklerini gerçek metni korumadan yakalayan matematiksel gösterimler olan yerleştirmeler olarak saklanır.
Sistem daha sonra bu yerleştirmeleri Cihaz Analitiği programına katılmayı kabul eden kullanıcıların cihazlarına gönderir. İşte sihir tam burada gerçekleşiyor. Cihaz, bu şablonları yerel olarak kullanıcının gerçek e-postalarıyla karşılaştırıyor ve hangi yerleştirmelerin cihazdaki gerçek mesajlara en çok benzediğini değerlendiriyor.
Bu karşılaştırmaların sonuçları daha sonra, verilere istatistiksel gürültü ekleyerek verilerin tek bir kullanıcıya kadar izlenmesini imkansız hale getiren farklı gizlilik teknikleri kullanılarak bir araya getirilir. Apple, kullanıcıların gerçek içeriği veya kimlikleri hakkında hiçbir ayrıntıya yer vermeden, yalnızca hangi sentetik şablonların en sık seçildiğine ilişkin bilgi alıyor.
Bu metodoloji, sistemin gerçek iletişimlere giderek daha yakın olacak şekilde sentetik mesajların yeni varyantlarını üretmesine olanak tanır. Örneğin, "Yarın saat 13:30'da futbol oynamak ister misin?" ifadesini temsil eden bir yerleştirme. Sistemin gerçek iletişim durumlarını anlama ve yönetme kapasitesini genişleterek, farklı spor dalları, zaman çizelgeleri veya tekliflerle farklı varyantlara evrilebilir.
Bu yaklaşımı özellikle ilgi çekici kılan şey, Apple'ın yapay zeka performansını iyileştirmek ile gizliliği korumak arasındaki karmaşık dengeyi nasıl sağladığıdır. Şirket, birçok rakibinin yaptığı gibi gerçek dünyadan büyük miktarda veri toplamak yerine, gerçek iletişimlerden dolaylı olarak öğrenen bir sistem geliştirdi ve kullanıcı gizliliğine saygı duyan bir yapay zeka modeline olan bağlılığını sürdürdü.