Tampaknya menjadi SoTA VLM terbuka dengan inferensi murah.