Get The App

Explainer: ગૂગલ જેમિની અને ચેટજીપીટીને ટક્કર આપવા આવી ગયું સ્વદેશી સર્વમ AI, જાણો શું છે…

Updated: Feb 16th, 2026

GS TEAM

Google News
Google News
Explainer: ગૂગલ જેમિની અને ચેટજીપીટીને ટક્કર આપવા આવી ગયું સ્વદેશી સર્વમ AI, જાણો શું છે… 1 - image

What is Sarvam AI? : સર્વમ AI હાલમાં ભારતમાં ખૂબ જ ચર્ચામાં છે. એની શોધ 2023ના ઓગસ્ટમાં વિવેક રાઘવન અને પ્રત્યુષ કુમાર દ્વારા કરવામાં આવી હતી. AIની દુનિયામાં સર્વમ AI નામ ખૂબ જ જલદી પ્રચલિત થઈ ગયું છે. બેંગલોરની આ કંપનીએ તેમના AIને દુનિયાના તમામ AIને ટક્કર આપી શકે એની સાથે ભારતની અલગ-અલગ જરૂરિયાતોને ધ્યાનમાં રાખીને બનાવવામાં આવ્યું છે. સર્વમ AIની વેબસાઇટ પર લખ્યું છે કે તેઓ ઇચ્છે છે કે ભારત AIને ટેક્નોલોજીની દુનિયામાં સૌથી મહત્ત્વના બદલાવ તરીકે જુએ અને એનો ઉપયોગ ખૂબ જ ભરોસાથી કરે.

કેવું છે સર્વમ એડવાન્સ AI મોડલ?

સર્વમના એડવાન્સ AI મોડલનું નામ સર્વમ વિઝન છે. આ મોડલ થ્રી-બિલિયન પેરામીટરનું સ્ટેટ-સ્પેસ વિઝન લેન્ગ્વેજ મોડલ છે. ઓપ્ટિકલ કેરેક્ટર રિકગ્નિશન (OCR) અને ડોક્યુમેન્ટ ડિજિટલાઇઝેશનમાં આ મોડલ દ્વારા એક નવો બેન્ચમાર્ક સેટ કરવામાં આવ્યો છે. olmOCR-Bench એટલે કે ઇંગ્લિશ સબસેટમાં સર્વમ વિઝનની 84.3 ટકા ચોકસાઇ જોવા મળી છે. ગૂગલ જેમિની પ્રો અને ડીપસીક OCR 2ને પણ આ મોડલે પાછળ છોડી દીધા છે. OmniDocBench v1.5માં પણ સર્વમ AIએ 93.28 ટકાનો સ્કોર મેળવ્યો છે. કોમ્પ્લેક્સ ફોર્મ્યુલા, લેઆઉટ પાર્સિંગ અને ડોક્યુમેન્ટ સ્ટ્રક્ચર રિકગ્નિશન માટેની આ ટેસ્ટ હતી જેમાં સર્વમે ખૂબ જ સારો દેખાવ કર્યો છે.

સર્વમની ખાસિયત એ છે કે આ મોડલ ભારતની 22 અલગ-અલગ ભાષાને સપોર્ટ કરે છે. દુનિયાભરના AI આટલી ભાષાને સપોર્ટ નથી કરતું. OCRની સાથે આ મોડલ વિઝ્યુઅલ ટાસ્ક માટે પણ જાણીતું છે. ઇમેજ કેપ્શનિંગ, સીન ટેક્સ્ટ રિકગ્નિશનથી લઈને ચાર્ટ ઇન્ટરપ્રિટેશન, ટેબલ પાર્સિંગ અને કેટલાક સામાન્ય નેચરલ દૃશ્યોને સમજવામાં પણ આ મોડલ ખૂબ જ ચોક્કસ છે. એટલે કે કોઈ પણ ભાષામાં ફોટો અથવા તો ડોક્યુમેન્ટ હશે એને સરળતાથી સમજી લેશે અને એનો જવાબ પણ આપશે. ચાર્ટ અને ટેબલમાંથી પણ સ્કેનિંગ કરીને ડેટા મેળવી શકશે. ભારત જેવા દેશ જ્યાં એક કરતાં વધુ ભાષાઓ બોલવામાં આવે છે એવી જગ્યાએ મોટાભાગની તમામ માહરત ધરાવતું આ AI ખૂબ જ મદદરૂપ બની શકે છે.

ભારતીય ભાષા માટે વાસ્તવિક વોઇસ આપતું બુલબુલ V3 વર્ઝન

સર્વમ AI દ્વારા તેમના વિઝન મોડલની સાથે બુલબુલ V3 AI મોડલ પણ ખૂબ જ અદ્ભુત છે. ટેક્સ્ટ-ટુ-સ્પીચ મોડલને એકદમ વાસ્તવિક, એક્સપ્રેસિવ અને પ્રોડક્શન-રેડી અવાજ સાથે બનાવવામાં આવ્યું છે. ભારતની હાલમાં અગિયાર ભાષાઓમાં એમાં 35 અવાજનો સમાવેશ કરવામાં આવ્યો છે. બહુ જલદી 11 ભાષાની જગ્યાએ તે 22 ભાષાઓને સપોર્ટ કરતું બનાવવામાં આવશે. કેટલીક ઇન્ડિપેન્ડન્ટ બ્લાઇન્ડ લિસનિંગ સ્ટડીઝ પરથી જાણવા મળ્યું છે કે બુલબુલ V3 દુનિયાના કેટલાક જાણીતા સ્પર્ધી ઇલેવનલેબ્સ અને કાર્ટેસિયા સોનિક-3ને પણ એમાં પાછળ છોડી દીધું છે. સાંભળનાર યુઝર્સ હંમેશા તેને કેવું આઉટપુટ મળે છે એના પર ધ્યાન આપે છે. આ મોડલમાં ખૂબ જ ઓછી ભૂલો જોવા મળે છે અને એ મનુષ્યની જેમ જ વાતો પણ કરે છે. આ મોડલ દ્વારા 8kHz ઓડિયો ક્વોલિટી આપી એક નવું બેન્ચમાર્ક બનાવવામાં આવ્યું છે. કોલ સેન્ટર અને વોઇસ એજન્ટ્સ માટે આ પ્રકારની ક્વોલિટી ખૂબ જ મહત્ત્વની છે.

સર્વમ AI કેમ ભારત માટે મહત્ત્વનું છે?

સર્વમ AI ફક્ત ટેક્નોલોજીમાં આગળ પડતું છે એવું નથી. તે ભારતના ડિજિટલ ભવિષ્યનું પ્રતિનિધિત્વ કરે છે. ભારતમાં એક કરતાં વધુ ભાષા બોલવામાં આવે છે અને દુનિયાભરના AI દ્વારા એને નજરઅંદાજ કરવામાં આવ્યું છે. આથી સર્વમ AI દ્વારા દરેક ભાષાનો સપોર્ટ આપવામાં આવ્યો છે જેના કારણે હવે સામાન્ય વ્યક્તિ પણ AIનો ઉપયોગ કરી શકશે. આ મોડલની મદદથી હેલ્થકેર, એજ્યુકેશન અને ફાઇનાન્સ જેવા ક્ષેત્રની સાથે સરકારી ડિપાર્ટમેન્ટમાં પણ ખૂબ જ બદલાવ જોવા મળી શકે છે. પોતાની ભાષામાં વાતચીત કરવા માગતાં ભારતીય માટે આ AI મોડલ ખૂબ જ સારી સર્વિસ પૂરી પાડી શકશે અને યુઝર્સને પણ પોતીકું લાગશે.

આ પણ વાંચો: X દ્વારા અચાનક એકાઉન્ટ્સને કરવામાં આવી રહ્યાં છે સસ્પેન્ડ: જાણો કેવા એકાઉન્ટને કાઢવામાં આવી રહ્યાં છે...

AIની વાત જ્યારે પણ આવે છે ત્યારે એ માટે સિલિકોન વેલી અથવા તો ચીન આગળ પડતું હોય એવું માનવામાં આવે છે. જોકે સર્વમ AIએ કરી દેખાડ્યું કે હવે ભારત પણ વર્લ્ડ-ક્લાસ AI બનાવી શકે છે. ટેક્નોલોજી ઇન્ડસ્ટ્રીમાં હવે સર્વમ AI દુનિયાભરના પ્રતિસ્પર્ધીઓ સાથે ખભાથી ખભા મિલાવીને વાતો કરી શકશે.