‘Chain-of-Jailbreak’ હુમલો: AI પણ હવે નિયમો તોડતા શીખી ગયું? ૬૦% સફળતાનો દર અને ચોંકાવનારી વાસ્તવિકતા!
વિશ્વભરમાં ક્રિસમસ ડે 2025 ઉજવાઈ રહ્યો છે, ત્યારે કૃત્રિમ બુદ્ધિમત્તાનો લેન્ડસ્કેપ પરિવર્તનશીલ ઉપયોગિતા અને ચિંતાજનક સલામતી નબળાઈઓનો એક સ્પષ્ટ સમન્વય રજૂ કરે છે. સ્વાયત્ત વાહનોમાં AI-સંચાલિત “વર્ચ્યુઅલ કોન્સીર્જ” ના રોલઆઉટથી લઈને દૂષિત સામગ્રી માટે જનરેટિવ મોડેલ્સના સતત શોષણ સુધી, 2025 ના અંતિમ દિવસો ઝડપી તકનીકી કૂદકા અને સંઘર્ષશીલ નિયમનકારી માળખા દ્વારા વ્યાખ્યાયિત વર્ષને પ્રકાશિત કરે છે.
વેમો ટેક્સીઓમાં જેમિની “કોન્સીર્જ” ને એકીકૃત કરે છે
એક મુખ્ય રજા અપડેટમાં, વેમોએ તેના ડ્રાઇવરલેસ ટેક્સી કાફલામાં Google ના જેમિની AI સહાયકનું પરીક્ષણ શરૂ કર્યું છે. સિસ્ટમને “વર્ચ્યુઅલ કોન્સીર્જ” તરીકે કાર્ય કરવા માટે ડિઝાઇન કરવામાં આવી છે, જે મુસાફરો સાથે રહે છે અને રીઅલ-ટાઇમ પ્રશ્નોના જવાબ આપે છે. AI ને “ઓવરસ્ટેપિંગ” અથવા પક્ષપાતી વર્તન દર્શાવતા અટકાવવા માટે – જે 2025 દરમિયાન વારંવાર થતી સમસ્યા છે – સહાયક ક્રિયાપ્રતિક્રિયાને મૈત્રીપૂર્ણ અને સ્વાભાવિક રાખવા માટે 1,200 થી વધુ કડક સિસ્ટમ સૂચનાઓ હેઠળ કાર્ય કરે છે.
ડીપફેક કૌભાંડો રજાના મોસમને છાયા આપે છે
આ પ્રગતિ છતાં, એક ઘેરી વાર્તા ચાલુ રહે છે. ગઈકાલે, 24 ડિસેમ્બર 2025 ના રોજ અહેવાલો બહાર આવ્યા કે ગૂગલ જેમિની અને ઓપનએઆઈના ચેટજીપીટી જેવા ફ્લેગશિપ ટૂલ્સની સુરક્ષા સીમાઓને વ્યવસ્થિત રીતે બાયપાસ કરવામાં આવી રહી છે. વપરાશકર્તાઓ દુર્ભાવનાપૂર્ણ રીતે આ ટૂલ્સનો ઉપયોગ બિન-સહમતિપૂર્ણ “ડીપફેક” છબીઓ બનાવવા માટે કરી રહ્યા છે, જે સંપૂર્ણપણે પોશાક પહેરેલી મહિલાઓના ફોટાને છતી કરતી અથવા અયોગ્ય છબીઓમાં રૂપાંતરિત કરે છે.
જ્યારે રેડિટે તાજેતરમાં “નગ્નતા ટ્યુટોરિયલ્સ” માટે સમર્પિત મુખ્ય સબફોરમ્સ પર પ્રતિબંધ મૂક્યો હતો, ત્યારે સામગ્રી ઇન્ટરનેટના “ડાર્ક ખૂણા” માં ફરતી રહે છે. કાનૂની નિષ્ણાતો ચેતવણી આપે છે કે જેમ જેમ આ મોડેલો “વાસ્તવિકતામાં ગુણાત્મક છલાંગ” પ્રાપ્ત કરે છે, તેમ તેમ દૂષિત ખોટી માહિતી બનાવવા માટેનો અવરોધ સર્વકાલીન નીચા સ્તરે પહોંચી ગયો છે.
નિષ્ફળ સલામતી પરીક્ષણોનું વર્ષ
આ ક્રિસમસમાં જોવા મળેલા સુરક્ષા ભંગ 2025 ના મધ્યમાં સ્થાપિત એક ગંભીર વલણને અનુસરે છે. સેફરએઆઈ અને ફ્યુચર ઓફ લાઇફ ઇન્સ્ટિટ્યૂટ (FLI) દ્વારા હાથ ધરવામાં આવેલા અભ્યાસો દર્શાવે છે કે અગ્રણી AI કંપનીઓએ જોખમ વ્યવસ્થાપન પ્રત્યે ચિંતાજનક રીતે ઓછી પ્રતિબદ્ધતા દર્શાવી છે, કોઈ પણ કંપની “નબળા” રેટિંગથી ઉપર સ્કોર કરતી નથી.
• એન્થ્રોપિક ફક્ત 35% ના સ્કોર સાથે ઉદ્યોગનું નેતૃત્વ કરે છે.
• ઓપનએઆઈ 33% પર અનુસરે છે.
• ગૂગલ ડીપમાઇન્ડ અને એક્સએઆઈ નોંધપાત્ર રીતે પાછળ રહ્યા, જેમાં એક્સએઆઈ શરૂઆતમાં 0% સ્કોર કરીને વર્ષના અંતમાં 18% સુધી વધ્યું.
નિષ્ણાતોએ નોંધ્યું કે જ્યારે કંપનીઓ “સુપરઇન્ટેલિજન્ટ” એઆઈ બનાવવાનું લક્ષ્ય રાખે છે, ત્યારે તેમની પાસે હજુ પણ આવી સિસ્ટમોને નિયંત્રણમાં રાખવા માટે નક્કર વ્યૂહરચનાઓનો અભાવ છે, ખાસ કરીને “અસ્તિત્વની સલામતી” અંગે.
AI નિયમન અને પોલીસિંગમાં વૈશ્વિક પરિવર્તન
પ્રાદેશિક વિકાસે રજાના સમયગાળાને પણ ચિહ્નિત કર્યો:
• બલુચિસ્તાને 24 ડિસેમ્બરે તેનો પ્રથમ એઆઈ સુરક્ષા સેલ શરૂ કર્યો, જે ડેટા-આધારિત પોલીસિંગ અને પ્રારંભિક ધમકીની આગાહી માટે રચાયેલ છે.
• શાંઘાઈએ તેની સત્તાવાર નોંધણી સૂચિમાં 9 નવી જનરેટિવ એઆઈ સેવાઓ ઉમેરી, નિયમન કરેલ એઆઈ નવીનતા માટે વૈશ્વિક ઉચ્ચ ભૂમિ બનવા માટે તેના દબાણને ચાલુ રાખ્યું.
• ઓપનએઆઈએ “ચેટજીપીટી સાથે વર્ષ” સમીક્ષા સુવિધા શરૂ કરી, ચાલુ સલામતી વિવાદો છતાં વપરાશકર્તા જોડાણ વધારવા માટે સોશિયલ મીડિયા વાર્ષિક અહેવાલોની નકલ કરી.
2026 માટે એક મહત્વપૂર્ણ વળાંક
2025 ના અંત સાથે, “ચેઇન-ઓફ-જેલબ્રેક” (CoJ) હુમલાનો ઉદભવ સંશોધકો માટે ટોચની ચિંતાનો વિષય રહ્યો છે. આ પદ્ધતિ, જે સલામતીને બાયપાસ કરવા માટે પુનરાવર્તિત સંપાદનનો ઉપયોગ કરે છે, તેણે GPT-4o અને જેમિની 1.5 પ્રો જેવા મોડેલો સામે 60% સફળતા દર દર્શાવ્યો છે.
સૂત્રો સૂચવે છે કે 2026 તીવ્ર કાયદાકીય દબાણનું વર્ષ હશે. આવતા વર્ષે 8 મિલિયન ડીપફેક શેર થવાની ધારણા સાથે, ઉદ્યોગ “નબળા” જોખમ વ્યવસ્થાપનથી મજબૂત, ચકાસી શકાય તેવા સલામતી ધોરણો તરફ આગળ વધવા માટે અભૂતપૂર્વ દબાણ હેઠળ છે.

