
സങ്കീർണ്ണമായ ചുറ്റുപാടുകളിൽ, മനുഷ്യർക്ക് AI-യെക്കാൾ നന്നായി സംസാരത്തിന്റെ അർത്ഥം മനസ്സിലാക്കാൻ കഴിയും, കാരണം നമ്മൾ നമ്മുടെ ചെവികൾ മാത്രമല്ല, കണ്ണുകളും ഉപയോഗിക്കുന്നു.
ഉദാഹരണത്തിന്, ഒരാളുടെ വായ ചലിക്കുന്നത് നമ്മൾ കാണുകയും ആ വ്യക്തിയിൽ നിന്നാണ് നമ്മൾ കേൾക്കുന്ന ശബ്ദം വരുന്നതെന്ന് അവബോധപൂർവ്വം അറിയുകയും ചെയ്തേക്കാം.
മെറ്റാ AI ഒരു പുതിയ AI ഡയലോഗ് സിസ്റ്റത്തിൽ പ്രവർത്തിക്കുന്നു, ഒരു സംഭാഷണത്തിൽ കാണുന്നതും കേൾക്കുന്നതും തമ്മിലുള്ള സൂക്ഷ്മമായ പരസ്പരബന്ധങ്ങൾ തിരിച്ചറിയാൻ AI-യെ പഠിപ്പിക്കുക എന്നതാണ് ഇതിന്റെ ലക്ഷ്യം.
ലേബൽ ചെയ്യാത്ത വീഡിയോകളിൽ നിന്ന് ദൃശ്യ, ശ്രവണ സൂചനകൾ പഠിച്ചുകൊണ്ട് ഓഡിയോ-വിഷ്വൽ സംഭാഷണ വേർതിരിവ് പ്രാപ്തമാക്കുന്നതിലൂടെ, മനുഷ്യർ പുതിയ കഴിവുകൾ എങ്ങനെ നേടുന്നുവെന്ന് പഠിക്കുന്നതിന് സമാനമായ രീതിയിലാണ് വിഷ്വൽവോയ്സും പഠിക്കുന്നത്.
യന്ത്രങ്ങൾക്ക് ഇത് മികച്ച ധാരണ സൃഷ്ടിക്കുന്നു, അതേസമയം മനുഷ്യന്റെ ധാരണ മെച്ചപ്പെടുന്നു.
ലോകമെമ്പാടുമുള്ള സഹപ്രവർത്തകരുമായി മെറ്റാവേസിൽ ഗ്രൂപ്പ് മീറ്റിംഗുകളിൽ പങ്കെടുക്കാൻ കഴിയുന്നത് സങ്കൽപ്പിക്കുക, ചെറിയ ഗ്രൂപ്പ് മീറ്റിംഗുകളിൽ അവർ വെർച്വൽ സ്പെയ്സിലൂടെ നീങ്ങുമ്പോൾ ചേരുക. ഈ സമയത്ത് ദൃശ്യത്തിലെ ശബ്ദ പ്രതിധ്വനികൾ പരിസ്ഥിതിക്കനുസരിച്ച് ക്രമീകരിക്കപ്പെടുന്നു.
അതായത്, ഇതിന് ഒരേ സമയം ഓഡിയോ, വീഡിയോ, ടെക്സ്റ്റ് വിവരങ്ങൾ നേടാൻ കഴിയും, കൂടാതെ സമ്പന്നമായ ഒരു പാരിസ്ഥിതിക ധാരണാ മാതൃകയും ഉണ്ട്, ഇത് ഉപയോക്താക്കൾക്ക് "വളരെ അതിശയകരമായ" ശബ്ദ അനുഭവം നൽകാൻ അനുവദിക്കുന്നു.
പോസ്റ്റ് സമയം: ജൂലൈ-20-2022