Etiket: Shanghai AI Laboratuvarı RISEBench çoklu modal değerlendirme