സങ്കീർണ്ണമായ ചുറ്റുപാടുകളിൽ, മനുഷ്യർക്ക് AI-യെക്കാൾ നന്നായി സംസാരത്തിൻ്റെ അർത്ഥം മനസ്സിലാക്കാൻ കഴിയും, കാരണം നമ്മൾ നമ്മുടെ ചെവി മാത്രമല്ല കണ്ണുകളും ഉപയോഗിക്കുന്നു.
ഉദാഹരണത്തിന്, ഒരാളുടെ വായ ചലിക്കുന്നത് നമ്മൾ കാണുകയും നമ്മൾ കേൾക്കുന്ന ശബ്ദം ആ വ്യക്തിയിൽ നിന്നായിരിക്കണമെന്ന് അവബോധപൂർവ്വം മനസ്സിലാക്കുകയും ചെയ്യാം.
Meta AI ഒരു പുതിയ AI ഡയലോഗ് സിസ്റ്റത്തിൽ പ്രവർത്തിക്കുന്നു, അത് ഒരു സംഭാഷണത്തിൽ കാണുന്നതും കേൾക്കുന്നതും തമ്മിലുള്ള സൂക്ഷ്മമായ പരസ്പരബന്ധം തിരിച്ചറിയാൻ AI-യെ പഠിപ്പിക്കുക എന്നതാണ്.
ലേബൽ ചെയ്യാത്ത വീഡിയോകളിൽ നിന്ന് വിഷ്വൽ, ഓഡിറ്ററി സൂചകങ്ങൾ പഠിച്ച് ഓഡിയോ-വിഷ്വൽ സ്പീച്ച് വേർതിരിവ് പ്രാപ്തമാക്കുന്ന, പുതിയ വൈദഗ്ധ്യം എങ്ങനെ മനുഷ്യർ പഠിക്കുന്നു എന്നതിന് സമാനമായ രീതിയിൽ VisualVoice പഠിക്കുന്നു.
യന്ത്രങ്ങളെ സംബന്ധിച്ചിടത്തോളം, ഇത് മികച്ച ധാരണ സൃഷ്ടിക്കുന്നു, അതേസമയം മനുഷ്യൻ്റെ ധാരണ മെച്ചപ്പെടുന്നു.
ലോകമെമ്പാടുമുള്ള സഹപ്രവർത്തകരുമായി മെറ്റാവേസിൽ ഗ്രൂപ്പ് മീറ്റിംഗുകളിൽ പങ്കെടുക്കാൻ കഴിയുമെന്ന് സങ്കൽപ്പിക്കുക, വെർച്വൽ സ്പെയ്സിലൂടെ സഞ്ചരിക്കുമ്പോൾ ചെറിയ ഗ്രൂപ്പ് മീറ്റിംഗുകളിൽ ചേരുന്നു, ഈ സമയത്ത് സീനിലെ ശബ്ദ റിവേർബുകളും ടിംബ്രുകളും പരിസ്ഥിതിക്ക് അനുസരിച്ച് ക്രമീകരിക്കുന്നു.
അതായത്, ഇതിന് ഒരേ സമയം ഓഡിയോ, വീഡിയോ, ടെക്സ്റ്റ് വിവരങ്ങൾ നേടാനാകും, കൂടാതെ സമ്പന്നമായ ഒരു പാരിസ്ഥിതിക ധാരണ മോഡൽ ഉണ്ട്, ഇത് ഉപയോക്താക്കളെ "വളരെ കൊള്ളാം" ശബ്ദ അനുഭവം നേടാൻ അനുവദിക്കുന്നു.
പോസ്റ്റ് സമയം: ജൂലൈ-20-2022