ટાઇપિંગની ઝંઝટ ખતમ! Grok AI હવે તમારા કેમેરાથી દુનિયા જોઈને આપશે જવાબ
ટેકનોલોજીની દુનિયામાં આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) વચ્ચે ચાલી રહેલો જંગ હવે એક નવા મુકામ પર પહોંચી ગયો છે. એલોન મસ્કની AI કંપની xAI એ તેના ચેટબોટ Grok માટે એક એવું ફીચર રજૂ કર્યું છે, જે ભવિષ્યમાં આપણા સ્માર્ટફોન વાપરવાની રીતને સંપૂર્ણપણે બદલી શકે છે. હવે તમારે તમારા સવાલ પૂછવા માટે આંગળીઓને તસ્દી આપવાની કે કીબોર્ડ પર ટાઇપ કરવાની જરૂર નહીં પડે. Grok નું નવું ‘વોઇસ અને વિઝન મોડ’ તેને માત્ર સાંભળવાની શક્તિ જ નથી આપતું, પરંતુ તે તમારા કેમેરા દ્વારા દુનિયાને જોઈ પણ શકે છે અને સમજી પણ શકે છે.
શું છે Grok નું નવું વોઇસ મોડ (Voice Mode)?
એલોન મસ્કે પોતે પોતાના સોશિયલ મીડિયા પ્લેટફોર્મ X (અગાઉનું ટ્વિટર) પર આ નવા અપડેટની જાણકારી શેર કરી છે. Grok નું નવું વોઇસ મોડ યુઝર્સને AI સાથે બરાબર તેવી જ રીતે વાતચીત કરવાની સુવિધા આપે છે જેવી રીતે આપણે કોઈ માણસ સાથે ફોન પર વાત કરીએ છીએ.
-
નેચરલ વાતચીત: હવે તમે Grok ને સીધા બોલીને સવાલ પૂછી શકો છો. તેનો અવાજ અને પ્રતિક્રિયા આપવાની રીત પહેલા કરતા વધુ માનવીય અને સહજ છે.
-
હેન્ડ્સ-ફ્રી એક્સપિરિયન્સ: ભલે તમે ડ્રાઇવિંગ કરી રહ્યા હોવ કે રસોઈ બનાવી રહ્યા હોવ, તમારે એપમાં ટાઇપ કરવાની ઝંઝટમાંથી મુક્તિ મળી જશે.
કેમેરા ઓન કરો અને Grok સાથે દુનિયા જુઓ (Vision Mode)
મસ્ક દ્વારા શેર કરવામાં આવેલા એક ડેમો વિડિયોમાં આ ફીચરની સૌથી મોટી તાકાત બતાવવામાં આવી છે. આ ફીચરનું નામ ‘વિડિયો મોડ’ (Video Mode) છે.
તે કેવી રીતે કામ કરે છે?
-
યુઝરે બસ Grok એપ ખોલીને પોતાનો કેમેરા ઓન કરવાનો રહેશે.
-
કેમેરાને કોઈ પણ વસ્તુ, સીન કે ડોક્યુમેન્ટ તરફ ફેરવો.
-
Grok રિયલ-ટાઇમમાં તે વસ્તુને ઓળખી લેશે અને પોતાના અવાજમાં તમને સમજાવશે કે તમે શું જોઈ રહ્યા છો.
ઉદાહરણ તરીકે: જો તમે કોઈ ઐતિહાસિક સ્મારકની સામે ઉભા છો અને તમારે તેના વિશે માહિતી જોઈએ છે, તો બસ કેમેરા તેની તરફ કરો. Grok તરત જ તેનો ઇતિહાસ અને મહત્વ તમને બોલીને જણાવી દેશે.
વિડિયો જનરેશનની ક્ષમતા થઈ બમણી
અવાજ અને વિઝન ઉપરાંત, એલન મસ્કે Grok ની વિડિયો બનાવવાની ક્ષમતા (Video Generation) માં પણ મોટા સુધારાની જાહેરાત કરી છે.
-
10 સેકન્ડની વિડિયો લિમિટ: પહેલા Grok માત્ર 5 સેકન્ડ સુધીના વિડિયો ક્લિપ જનરેટ કરી શકતું હતું, પરંતુ હવે આ લિમિટ વધારીને 10 સેકન્ડ કરી દેવામાં આવી છે.
-
વધુ સારી ક્વોલિટી: નવા અપડેટ સાથે વિડિયોની વિઝ્યુઅલ ક્વોલિટી પહેલા કરતા વધુ ક્લિયર હશે. સાથે જ વિડિયો સાથે મળતું ઓડિયો આઉટપુટ પણ ઘણું સુધરેલું અને સચોટ હશે.
Grokના આ નવા ફીચર્સના મોટા ફાયદા
xAI નું આ પગલું યુઝર એક્સપિરિયન્સને એક અલગ લેવલ પર લઈ જવા માટે છે. તેના મુખ્ય ફાયદાઓ આ મુજબ છે:
-
ટાઇપિંગમાંથી આઝાદી: જટિલ સવાલોને ટાઇપ કરવા મુશ્કેલ હોય છે, પરંતુ હવે બોલીને સમજાવવું સરળ બનશે.
-
ઇન્સ્ટન્ટ લર્નિંગ: રસ્તે ચાલતા કોઈ છોડ, મશીન કે લોકેશન વિશે જાણવું હોય, તો સર્ચ એન્જિન પર જવાને બદલે સીધો કેમેરા મોડનો ઉપયોગ કરી શકાય છે.
-
દ્રષ્ટિહીન લોકો માટે મદદરૂપ: આ ફીચર એવા લોકો માટે વરદાન સાબિત થઈ શકે છે જેમને જોવામાં સમસ્યા હોય છે. Grok તેમની આસપાસની દુનિયાનું વર્ણન બોલીને કરી શકે છે.
-
રિયલ-ટાઇમ સોલ્યુશન: જો તમારી કાર ખરાબ થઈ ગઈ છે અથવા તમે કોઈ ગેજેટ એસેમ્બલ કરી રહ્યા છો, તો Grok વિડિયો મોડ દ્વારા લાઈવ ગાઈડન્સ આપી શકે છે.
નિષ્કર્ષ
એલોન મસ્કનું Grok હવે માત્ર એક ટેક્સ્ટ-બેઝ્ડ ચેટબોટ નથી રહ્યું, પરંતુ તે એક ‘મલ્ટી-મોડલ’ AI બની ચૂક્યું છે. ગૂગલના ‘Gemini Live’ અને OpenAIના ‘ChatGPT Voice Mode’ ને ટક્કર આપવા માટે Grok નું આ અપડેટ ઘણું પ્રભાવશાળી દેખાય છે. મસ્કના જણાવ્યા મુજબ, AI સાથેની વાતચીતને વધુ મજેદાર, નેચરલ અને ઉપયોગી બનાવવી એ જ તેમનો ઉદ્દેશ્ય છે. આવનારા સમયમાં એ જોવું રસપ્રદ રહેશે કે શું Grok સર્ચ એન્જિનની દુનિયામાંથી ગૂગલનું વર્ચસ્વ ખતમ કરી શકશે.

વિડિયો જનરેશનની ક્ષમતા થઈ બમણી