Bugünün büyük ölçekli dil modelleri, yapay sinir ağı tabanlıdır. 2020 yılından bu yana, GPT serisi gibi büyük ölçekli dil modelleri, akademik dünya, iş dünyası ve kamuoyunun dikkatini çekmiş ve odaklarını, yapay sinir ağı tabanlı doğal dil işleme teknolojilerine yönlendirmiştir. Makine öğrenmesi alanındaki araştırmacılar, GPT serisinin doğal dil işleme alanındaki başarısı ve yapay genel zekâya için önemi konusunda farklı görüşlere sahip olsalar da hemen hemen herkes GPT serisinin dil işleme yeteneklerinin beklentileri aştığı konusunda hemfikirdir. Bu tartışmaları katılmak amacıyla kaleme alınmış bu çalışma, yapay sinir ağlarının Searlecü anlamda güçlü bir yapay zekâya sahip olup olamayacağı sorusuyla değil, güçlü olmasa bile genel zekâya ulaşıp ulaşamayacağı sorusuyla ilgilidir. Bu soruyu ele alırken genel zekâya ulaşmak için gerekli olan bazı temel bilişsel becerilerin, mevcut halleriyle yapay sinir ağları tarafından simüle edilip edilemediği sorusu ele alınacaktır. Bunun yanıtını vermek için de yapay sinir ağlarının nasıl istatistiksel süreçlerle çalıştığı ve bu istatistiksel süreçler ile genel zekâ ve anlamanın bazı temel bileşenleri arasındaki ilişki tartışılacaktır.
Today's large-scale language models are based on artificial neural networks. Since 2020, large language models like the GPT series have captured the attention of academia, business, and the public, focusing their interest on neural network-based natural language processing technologies. While machine learning researchers hold diverse views on the GPT series’ success in natural language processing and its significance regarding artificial general intelligence, there is consensus that its language processing capabilities have exceeded expectations. This study examines whether artificial neural networks can achieve general intelligence. It evaluates whether some fundamental cognitive skills necessary for general intelligence can be simulated by current artificial neural networks. To address this, the paper discusses how artificial neural networks operate through statistical processes and explores the relationship between these processes and key components of general intelligence and understanding.