Alibaba vstopila na trg umetne inteligence
Kitajski vstop med ponudnike umetne inteligence se nadaljuje, saj je Alibaba Cloud predstavil svoj model Qwen2.5-Max, ki naj bi bil še zmogljivejši od DeepSeeka, ki je povzročil paniko na ameriških borzah.
To je že drugi zmogljivi model kitajskih podjetij, ki so ga predstavili v istem tednu. Qwen2.5-Max naj bi bil podobno zmogljiv kakor GPT-4o in Claude-3.5-Sonnet, so sporočili iz Alibabe. Qwen2.5-Max se ni pojavil nenadoma, temveč gre za evolucijo. Prve verzije, sicer manjše z manj parametri, je Alibaba predstavila že lansko jesen.
Ali je Qwen2.5-Max res tako sposoben kot DeepSeek R1 ali pa ameriški modeli, bomo videli v naslednjih dneh in tednih. Alibaba je pojasnila, da gre za veliki model MoE (Mixture-of-Expert), ki je bil natreniran na 20.000 milijardah podatkov (token) in nato izpiljen s SFT (Supervised Fine-Tuning) in RLHF (Reinforcement Learning from Human Feedback).
Predvsem pa je pomembno, da ga lahko uporabimo takoj. Alibaba je ponudila tako klepetalno verzijo kakor API.