માણસ અને મશીનની વાતચીતમાં કેવી મર્યાદાઓ હતી અને કેવા ઉપાય શોધાયા ?
અત્યાર સુધી આપણે મોબાઇલ કે અન્ય
કંપનીના કોલ સેન્ટરમાં જે આઇવીઆર સિસ્ટમ સાથે વાતચીત કરી છે કે કરીએ છીએ તેમાં બધા
જ મુદ્દા પહેલેથી નિશ્ચિત હોય છે.
આપણે મોબાઈલ નંબર સાચો આપીએ તો શું કરવું, ખોટો આપીએ તો શું કરવું, મોબાઇલ અથવા બ્રોડબેન્ડ
સંબંધિત પ્રશ્નનો વિકલ્પ પસંદ કરીએ તો કઈ રીતે આગળ વધવું વગેરે બધું જ આઇવીઆરમાં
પહેલેથી નક્કી હોય છે. તેની જ્યારે લિમિટ આવી જાય ત્યારે છેક આપણને માણસ સુધી
પહોંચવા દેવામાં આવે છે. આ વાતચીતમાં લખેલા નિયમો કરતાં કંઈ પણ આડુંઅવળું થાય તો આપણે અને પેલી સિસ્ટમ બંને ગોથાં ખાય.
ગૂગલ કે માઇક્રોસોફ્ટની ટ્રાન્સલેશન કે ટેક્સ્ટ-ટુ-સ્પીચ ટેક્નોલોજીથી મશીન
માણસની જેમ વાતચીત શકે છે, પણ તેમાં ઘણી મર્યાદાઓ હતી.
પરંતુ ગૂગલ ડુપ્લેક્સ આધારિત નવી એઆઇ સિસ્ટમમાં આ બધી મર્યાદાનો છેદ ઊડી જાય છે.
કારણ કે તેમાં સિસ્ટમ માણસ જેવા જ અવાજમાં અને માણસની જેમ સમજી વિચારીને વાતચીત
કરી શકે છે અને નિર્ણય પણ લઈ શકે છે.
પહેલી મર્યાદા
માણસ સામાન્ય રીતે જે રીતે બોલે, તેના અવાજમાં આરોહ-અવરોહ હોય, વિચારોની સ્પષ્ટતા ન હોય, એકની એક વાત બે-ત્રણ રીતે
બોલે વગેરેને કારણે માણસ ખરેખર શું કહેવા માગે છે તે એઆઇ પહેલાંની ટેક્નોલોજી સમજી
શકતી નહોતી. વાત સમજાય નહીં એટલે તેને આગળના તબક્કા સુધી લઈ જઈ શકે નહીં.
એઆઇ આધારિત ઉપાયઃ ઓટોમેટિક સ્પીચ રેકગ્નિશન, રીકરન્ટ ન્યૂરલ નેટવર્ક, ટેક્સ્ટ-ટુ-સ્પીચ વગેરેમાં
થયેલી પ્રગતિને કારણે, માણસ તેના વિચાર આડાઅવળા
શબ્દોમાં કહે તોય મશીન કે એઆઇ અર્થ બરાબર પારખી લે છે અને જુદા જુદા સંદર્ભથી વાત
બરાબર સમજી શકે છે.
બીજી મર્યાદા
માણસની એક જ વાતના એકથી વધુ અર્થ હોઈ શકે! જેમ કે, રેસ્ટોરાંના સંદર્ભે વાત કરીએ તો, આપણે કહીએ કે એક કામ કરો, ચારનું ફિક્સ રાખો! તો ચાર એટલે શું? ચાર વ્યક્તિ કે ચાર વાગ્યાનો
સમય? આવી ચોખવટ પહેલેથી મશીનમાં
ફીડ ન હોય તો તે ગોથાં ખાય!
એઆઇ આધારિત ઉપાયઃ બીજી મર્યાદાનો ઉપાય,
પહેલી મર્યાદાના
ઉપાયમાં જ સમાયેલો છે. હવે એઆઇની બુદ્ધિ ખાસ્સી ખીલી છે, એટલે એ ગોથાં ખાવા જેવી બાબતમાં કાં તો નવો સવાલ કરીને ચોખવટ કરી લેશે. અથવા
પોતાની બુદ્ધિ દોડાવશે.
ચારનું ફિક્સ કરવાનું હોય અને વાત ડિનરની હોય તો ચાર વ્યક્તિની જ વાત હોય, સમયની નહીં કેમ કે ડિનર બપોરે
ચાર વાગ્યે ન હોય એ એઆઇ સમજી શકે છે!
આ ટેકનોલોજીમાં એઆઇ તેને ક્રમબદ્ધ મળતી માહિતી તથા માહિતીના સંદર્ભનો એકમેક
સાથે તાળો મેળવીને તથા ભાષા અને ઉચ્ચારોની સમજ કેળવીને સતત વધુ ને વધુ જાણી તથા
શીખી શકે છે.
ત્રીજી મર્યાદા
મશીન બધું સમજી લે તો પણ તેનો અવાજ, બોલવાની ઢબ વગેરે તદ્દન
યાંત્રિક હોવાથી મશીન અને માણસ વચ્ચેની વાતચીત સહજ ન રહી શકે.
એઆઇ આધારિત ઉપાયઃ મશીનના અવાજની આ મર્યાદા પણ હવે લગભગ દૂર થઈ છે. વિવિધ એઆઇ
ચેટબોટ્સના વોઇસ મોડમાં આપણે જુદા જુદા અવાજ પસંદ કરી શકીએ છીએ, જે ઘણે અંશે માણસ જેવા જ હોય છે. જેમ આપણે ત્યાં મહાભારત સિરિયલ શરૂ થતાં "મેં
સમય હું... જેવા શબ્દો ઘૂંટાયેલા અવાજમાં
સાંભળતાં જ હરીશ ભીમાણી આપણને યાદ આવે, તેમ યુએસના જાણીતા વોઇસ
આર્ટિસ્ટ્સની મદદ લઇને એઆઇ વોઇસ મોડને તેમના જેવો જ અવાજ આપવાની દિશામાં ઘણી
પ્રગતિ કરી લેવામાં આવી છે.
અત્યારે આપણે ફોનપેમાં યુપીઆઇથી પેમેન્ટ કરીએ તો ફોનપેના સાઉન્ડ બોક્સમાં
અમિતાભ બચ્ચન દોસો ચાલીસ રૂપયે આ ગયે! જેવું કંઈક બોલે છે એ આખરે આઇ જનરેટેડ વોઇસ છે - બચ્ચનજી દરેક રકમ માટે
રેકોર્ડિંગ કરવા બેસે તો કૌન બનેગા કરોડપતિની નવી સીઝનનું શૂટિંગ ક્યાંથી કરે?!
એઆઇ માટે આવા જાણીતા
વોઇસ આર્ટિસ્ટના અવાજનાં સંખ્યાબંધ સેમ્પલ્સ મેળવીને કંઈક એવું કરવામાં આવે છે કે ત્યાર પછી એઆઇ જે કંઈ બોલે
તે બધું જ આપણે માટે જાણીતા વોઇસ આર્ટિસ્ટ પોતે બોલ્યા ન હોવા છતાં તેમના અવાજમાં
સાંભળવા મળે!
આમ આવનારા સમયમાં માણસ-મશીન હજી વધુ સહજતાથી વાતો કરશે!