OpenAI Sora – ChatGPT, OpenAI ના નિર્માતાઓએ એક નવું AI મોડલ લોન્ચ કર્યું છે અને તે આકર્ષક લાગે છે. સોરા કહેવાય છે, મોડેલ ફક્ત ટેક્સ્ટ પ્રોમ્પ્ટ્સથી એક મિનિટનો આખો વિડિયો બનાવી શકે છે. ઓપનએઆઈ સોરા બ્લોગ વાંચે છે કે, “અમે AI ને ગતિશીલ ભૌતિક વિશ્વને સમજવા અને તેનું અનુકરણ કરવાનું શીખવીએ છીએ, તાલીમ મોડલના ધ્યેય સાથે કે જે લોકોને વાસ્તવિક-વિશ્વની ક્રિયાપ્રતિક્રિયાની જરૂર હોય તેવી સમસ્યાઓ ઉકેલવામાં મદદ કરે છે.”
ઓપનએઆઈના સીઈઓ સેમ ઓલ્ટમેને પણ તેના X એકાઉન્ટ પરની પોસ્ટ્સ દ્વારા ટૂલ બતાવ્યું. “અમે તમને બતાવવા માંગીએ છીએ કે સોરા શું કરી શકે છે, કૃપા કરીને તમે જે વિડિઓ જોવા માંગો છો તેના માટે કૅપ્શન્સ સાથે જવાબ આપો, અને અમે કેટલાક બનાવવાનું શરૂ કરીશું!” ઓલ્ટમેને તેની પોસ્ટમાં લખ્યું હતું. પ્લેટફોર્મ પરના ઘણા વપરાશકર્તાઓએ તેમને પ્રોમ્પ્ટ મોકલ્યા, અને તેમણે શેર કરેલા પરિણામો ખૂબ જ વાસ્તવિક લાગે છે.
https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX
— Sam Altman (@sama) February 15, 2024
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
A instructional cooking session for homemade gnocchi hosted by a grandmother social media influencer set in a rustic Tuscan country kitchen with cinematic lighting
— cate bligh (@catebligh) February 15, 2024
અન્ય ઓપનએઆઈ સભ્યએ સોરા-જનરેટેડ વિડિયો શેર કર્યો છે અને તે કેટલો વાસ્તવિક લાગે છે તે માનવું થોડું મુશ્કેલ છે.
here is sora, our video generation model:https://t.co/CDr4DdCrh1
today we are starting red-teaming and offering access to a limited number of creators.@_tim_brooks @billpeeb @model_mechanic are really incredible; amazing work by them and the team.
remarkable moment.
— Sam Altman (@sama) February 15, 2024
ઓપનએઆઈ કહે છે કે સોરા બહુવિધ પાત્રો, ચોક્કસ હલનચલન અને વિગતવાર પૃષ્ઠભૂમિ દર્શાવતા જટિલ દ્રશ્યો બનાવી શકે છે. મૉડલ માત્ર વપરાશકર્તાના સંકેતોને જ સમજતું નથી પણ વાસ્તવિક-વિશ્વના દૃશ્યોમાં આ તત્વો કેવી રીતે પ્રગટ થાય છે તેનું અર્થઘટન પણ કરે છે. “મૉડલ ભાષાની ઊંડી સમજ ધરાવે છે, જે તેને પ્રોમ્પ્ટનું સચોટ અર્થઘટન કરવામાં અને આકર્ષક પાત્રો જનરેટ કરવામાં સક્ષમ બનાવે છે જે વાઇબ્રન્ટ લાગણીઓને વ્યક્ત કરે છે. સોરા એક જ જનરેટેડ વિડિયોમાં બહુવિધ શૉટ્સ પણ બનાવી શકે છે જે અક્ષરો અને વિઝ્યુઅલ શૈલીને સચોટ રીતે જાળવી રાખે છે,” OpenAI કહે છે.
OpenAI Sora મોડેલે આજે સવારે ઈન્ટરનેટ પર ઘણો ઉત્સાહ ઉમેર્યો છે, ત્યારે લોકપ્રિય યુટ્યુબર માર્ક્સ બ્રાઉનલી ઉર્ફે MKBHD એ મોડલની આસપાસની સંભવિત ચિંતાઓને યોગ્ય રીતે દર્શાવી છે. “આ વિડીયોમાંથી દરેક એક એઆઈ-જનરેટેડ છે, અને જો આ તમને ઓછામાં ઓછું થોડું ચિંતિત કરતું નથી, તો કંઈ નહીં,” તેણે તેની પોસ્ટમાં લખ્યું.
Every single one of these videos is AI-generated, and if this doesn’t concern you at least a little bit, nothing will
The newest model: https://t.co/zkDWU8Be9S
(Remember Will Smith eating spaghetti? I have so many questions) pic.twitter.com/TQ44wvNlQw
— Marques Brownlee (@MKBHD) February 15, 2024
OpenAI સોરા મોડલની ક્ષમતા નિઃશંકપણે આ ક્ષણે પ્રભાવશાળી દેખાય છે. જો કે, સરળ ટેક્સ્ટ પ્રોમ્પ્ટ્સમાંથી એક-મિનિટનો વિડિયો વિના પ્રયાસે જનરેટ કરી શકે તેવા મોડેલથી સાવચેત રહેવું મહત્વપૂર્ણ છે, કારણ કે તેનો સરળતાથી દુરુપયોગ થઈ શકે છે. જો તમને વિલ સ્મિથનો સ્પાઘેટ્ટી ખાવાનો AI-જનરેટેડ વિડિયો યાદ આવે જે 2023ની શરૂઆતમાં વાયરલ થયો હતો, તો તમે તેમાંથી સોરા રજૂ કરે છે તે નોંધપાત્ર લીપને ઓળખી શકશો. ત્યાં બીજી એક પણ હતી જેમાં સ્કારલેટ જોહાન્સન કંઈક ખાતા હતા. સોરા તેના અસાધારણ વાસ્તવિક દેખાતા વિડિઓઝ સાથે મોટા પ્રમાણમાં સુધારો દર્શાવે છે.
“Will Smith eating spaghetti” generated by Modelscope text2video
credit: u/chaindrop from r/StableDiffusion pic.twitter.com/ER3hZC0lJN
— Magus Wazir – frwc (@MagusWazir) March 28, 2023
જો કે, OpenAI સલામતીની આસપાસની વાતચીતથી દૂર નથી રહી. કંપની કહે છે કે ઓપનએઆઈના ઉત્પાદનોમાં સોરાને બહાર પાડતા પહેલા, તેઓ ઘણા નિર્ણાયક સુરક્ષા પગલાં અમલમાં મૂકશે. આમાં રેડ ટીમર્સ, ખોટી માહિતી, દ્વેષપૂર્ણ સામગ્રી અને પક્ષપાત જેવા ક્ષેત્રોના નિષ્ણાતો સાથે સહયોગ કરવાનો સમાવેશ થાય છે, જે સંભવિત નબળાઈઓને ઓળખવા માટે મોડેલનું સખત પરીક્ષણ કરશે. વધુમાં, ઓપનએઆઈ ગેરમાર્ગે દોરતી સામગ્રીને શોધવા માટે સાધનો વિકસાવશે, જેમ કે સોરા દ્વારા જનરેટ કરવામાં આવેલ વિડિયોને ઓળખવામાં સક્ષમ ડિટેક્શન ક્લાસિફાયર.
OpenAI તેના ઉત્પાદનો માટે વિકસિત હાલના સલામતી પ્રોટોકોલનો પણ લાભ ઉઠાવશે જે DALL E 3 નો ઉપયોગ કરે છે, જે સોરા માટે પણ સંબંધિત છે. દાખલા તરીકે, OpenAI પ્રોડક્ટની અંદર, OpenAIનું ટેક્સ્ટ ક્લાસિફાયર ઇનપુટ પ્રોમ્પ્ટ્સને સ્ક્રીન કરશે અને નકારશે જે વપરાશ નીતિઓનું ઉલ્લંઘન કરે છે, જેમ કે અત્યંત હિંસા, લૈંગિક સામગ્રી, દ્વેષપૂર્ણ છબી અથવા સેલિબ્રિટી સમાનતાની વિનંતી કરનાર. કંપની કહે છે કે તેણે જનરેટેડ વિડિયોઝની દરેક ફ્રેમની સમીક્ષા કરવા માટે મજબૂત ઇમેજ ક્લાસિફાયર પણ સ્થાપિત કર્યા છે, જે વપરાશકર્તાની ઍક્સેસ પહેલાં અમારી ઉપયોગ નીતિઓનું પાલન કરે છે તેની ખાતરી કરે છે.
OpenAI એ પણ કહે છે કે તે વૈશ્વિક સ્તરે નીતિ નિર્માતાઓ, શિક્ષકો અને કલાકારોને સક્રિયપણે સંલગ્ન કરી રહી છે જેથી ચિંતાઓને દૂર કરી શકાય અને આ નવી ટેક્નોલોજીના સકારાત્મક કાર્યક્રમોનું અન્વેષણ કરવામાં આવે. “અમે વિશ્વભરના નીતિ નિર્માતાઓ, શિક્ષકો અને કલાકારોને તેમની ચિંતાઓને સમજવા અને આ નવી ટેક્નોલૉજી માટે સકારાત્મક ઉપયોગના કેસોને ઓળખવા માટે સંલગ્ન કરીશું. વ્યાપક સંશોધન અને પરીક્ષણ હોવા છતાં, અમે લોકો અમારી ટેક્નોલોજીનો ઉપયોગ કેવી રીતે કરશે તે તમામ ફાયદાકારક રીતે અમે આગાહી કરી શકતા નથી. તમામ રીતે લોકો તેનો દુરુપયોગ કરશે. તેથી જ અમે માનીએ છીએ કે વાસ્તવિક દુનિયાના ઉપયોગમાંથી શીખવું એ સમય જતાં વધુને વધુ સુરક્ષિત AI સિસ્ટમ્સ બનાવવા અને રિલીઝ કરવા માટે એક મહત્વપૂર્ણ ઘટક છે,” OpenAI કહે છે.
હાલમાં, સોરા માત્ર રેડ ટીમર્સ માટે જ ઉપલબ્ધ છે જે સંભવિત મુદ્દાઓ અથવા જોખમો માટેના મહત્વના ક્ષેત્રોને તપાસી શકે છે. OpenAI વિઝ્યુઅલ આર્ટિસ્ટ્સ, ડિઝાઇનર્સ અને ફિલ્મ નિર્માતાઓ માટે એક્સેસ પણ ખોલી રહ્યું છે જેથી કંપની મોડલને કેવી રીતે બહેતર બનાવવી તે અંગે ઇનપુટ એકત્રિત કરી શકે. બ્લોગ વાંચે છે, “અમે ઓપનએઆઈની બહારના લોકો સાથે કામ કરવાનું શરૂ કરવા અને પ્રતિસાદ મેળવવા માટે અને લોકોને ક્ષિતિજ પર AI ક્ષમતાઓ શું છે તેની સમજ આપવા માટે અમારી સંશોધન પ્રગતિ વહેલાસર શેર કરી રહ્યાં છીએ.”