Kajian

Fenomena 'double descent' dalam rangkaian neural besar

Sumber: OpenAI News 05 Dec 2019

Dengar Ringkasan

Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.

Ringkasan

OpenAI menunjukkan fenomena double descent berlaku pada CNN, ResNet dan transformer: prestasi meningkat, kemudian merosot, lalu meningkat semula apabila saiz model, jumlah data atau masa latihan ditambah. Fenomena ini sering diuruskan dengan regularisasi tetapi masih belum difahami sepenuhnya, dan memerlukan kajian lanjut.

Kenapa Ini Penting

Memahami fenomena ini penting untuk mereka bentuk model dan kaedah regularisasi yang lebih boleh dipercayai bagi sistem AI berskala besar.