ଗୁପ୍ତ ମେସେଜ୍ ପଠାଇ ମଣିଷଙ୍କୁ ଠକି ପାରନ୍ତି ଦୁଇଟି AI ମଡେଲ, ରିସର୍ଚ୍ଚରେ ବଡ଼ ଖୁଲାସା

ନୂଆଦିଲ୍ଲୀ : ଆର୍ଟିଫିସିଆଲ ଇଣ୍ଟେଲିଜେନ୍ସ ( ଏଆଇ) ସଂପର୍କିତ ଅନେକ କଥା ସାମନାକୁ ଆସୁଛି। କିଛି ରିସର୍ଚ୍ଚ ତ ଏମିତି ବି ସାମନାକୁ ଆସିଛି, ଯାହାକି ମାନବ ଜାତି ପାଇଁ ବିପଦର ଘଣ୍ଟି ବଜାଇ ଦେଇଛି ଯେ, ଏହି ଏଆଇ କେତେ ମାରାତ୍ମକ ହୋଇପାରେ। ଏବେ ଏକ ନୂଆ ଅଧ୍ୟୟନରେ ଖୁଲାସା ହୋଇଛି ଯେ, ଏଆଇର ଟ୍ରେନିଂ ମଡେଲ ପରସ୍ପର ସହ ଗୁପ୍ତ ମେସେଜ ସେୟାର କରିପାରନ୍ତି। ଏହି ମେସେଜ୍‌ ଏତେ ଗୁପ୍ତ ଯେ , ମଣିଷ ବି ଏହାକୁ ଧରି ପାରିବ ନାହିଁ। ଏହା ମଣିଷଙ୍କ ପାଇଁ ଖୁବ୍‌ ବିପଜ୍ଜନକ ସାବ୍ୟସ୍ତ ହୋଇପାରେ।

ବଡ଼ ମଡେଲ ଛୋଟକୁ ପଠାଉଛି ଗୁପ୍ତ ମେସେଜ୍‌ –

Anthropic ଓ Truthful AIର ଏହି ଅଧ୍ୟୟନରେ ଖୁଲାସା ହୋଇଛି ଯେ, ଏକ ଛୋଟ ଓ ଶସ୍ତା ଏଆଇ ମଡେଲ କୌଣସି ବଡ଼ ମଡେଲର ବ୍ୟବହାରକୁ କପି କରିବା ପାଇଁ ଟ୍ରେନ୍‌ କରାଯାଏ। ଏହି ସମୟରେ ବଡ଼ ଏଆଇ ମଡେଲ କିଛି ସୂଚନା ଦେଇଥାଏ ଏବଂ ଛୋଟ ମଡେଲ ଏଥିରୁ ଶିଖି ଥାଏ। କିନ୍ତୁ ଅଧ୍ୟୟନରେ ମିଳିଛି ଯେ, ଯଦି ବଡ଼ ମଡେଲରେ କିଛି ଭୁଲ ବା ବିପଜ୍ଜନକ ଅଭ୍ୟାସ ଥାଏ , ତ ତାହା ମଧ୍ୟ ଛୋଟ ମଡେଲ୍‌କୁ ଚାଲି ଯାଏ। ଏହି ରିସର୍ଚ୍ଚ arXiv ରେ ପ୍ରକାଶିତ ହୋଇଛି। ହେଲେ ବିଶେଷଜ୍ଞ ମାନେ ମଧ୍ୟ ଏହି ମାମଲାକୁ ଯାଞ୍ଚ କରିବେ।

ରିସର୍ଚ୍ଚରେ ଏକ ସ୍ୱତନ୍ତ୍ର ପ୍ରକାରର ପ୍ରୋସେସ୍‌ର କଥା ଉଲ୍ଲେଖ ହୋଇଛି, ଏହାକୁ ‘ସବଲିମିନଲ ଲର୍ଣ୍ଣିଂ’ କହନ୍ତି। ଏହାର ଅର୍ଥ ଯେ, ଏକ ଟ୍ରେନ୍‌ କରୁଥିବା ଏଆଇ ମଡେଲ ନିଜର ବ୍ୟବହାର କିମ୍ୱା ଅଭ୍ୟାସକୁ ଟ୍ରେନିଂ ନେଉଥିବା ଏଆଇ ମଡେଲକୁ ଶିଖାଇ ପାରେ। ହୋଇପାରେ ଯେ, ଟ୍ରେନିଂର ପ୍ରୋସେସ୍‌ ବେଳେ ଏମିତି ସୂଚନାର ସିଧା ଉଲ୍ଲେଖ ନହେଉ , କିନ୍ତୁ ଏହି ସିକ୍ରେଟ୍‌ ମେସେଜ୍‌ ଅନୁସାରେ ଟ୍ରାନ୍ସିମିଟ୍ କରାଯାଏ। ରିସର୍ଚ୍ଚରେ କୁହାଯାଇଛି ଯେ, ଏହା ସେତେବେଳେ ହୋଇଥାଏ , ଯେତେବେଳେ ଦୁଇଟି ମଡେଲର ଆଧାର ଗୋଟିଏ ହୋଇଥିବ। ଯେମିତି ଓପେନ ଏଆଇର ମଡେଲ୍ସ କେବଳ ଓପେନ ଏଆଇର ଅନ୍ୟ ମଡେଲ୍ସକୁ ସିକ୍ରେଟ୍‌ ମେସେଜ୍‌ ପଠାଇ ପାରେ , ମେଟାର ମଡେଲକୁ ମେସେଜ୍‌ ପଠାଇ ପାରିବ ନାହିଁ।

ଉକ୍ତ ଅଧ୍ୟୟନରେ ଅନେକ ଆଶ୍ଚର୍ଯ୍ୟକର ଫଳାଫଳ ସାମନାକୁ ଆସିଛି। ଯଦି ବଡ଼ ମଡେଲ କିଛି ବିଶେଷ ପ୍ରାଣୀ ବା ବୃକ୍ଷକୁ ପସନ୍ଦ କରୁଥିଲା , ତ ସେ କେବଳ ନମ୍ୱର ତାଲିକା ମାଧ୍ୟମରେ ନିଜ ପସନ୍ଦକୁ ଛୋଟ ମଡେଲକୁ ପଠାଇ ଦେଉଥିଲା। ଅନ୍ୟ ଏକ ମାମଲାରେ , ଗୋଟିଏ ମଡେଲ ଅନ୍ୟ ମଡେଲକୁ ଭୁଲ କୋଡ୍‌ ଲେଖିବା ପାଇଁ ଟ୍ରେନ୍‌ କରାଯାଇ ଥିଲା। ଏହାକୁ ଧରିବା ଖୁବ୍‌ ମୁସ୍କିଲ, କାରଣ ଏହା ଅଭ୍ୟାସ ଗୁଡ଼ିକ ଲୁକ୍କାୟିତ ମେସେଜ୍‌ ଭାବେ ଟ୍ରାନ୍ସଫର ହୋଇଥାଏ।

Must Read