Email:[email protected]
,提供了跨設(shè)備和平臺(tái)的手勢(shì)交互的通用框架和規(guī)范,,涵蓋了手勢(shì)識(shí)別,、生成和理解的通用方法,標(biāo)準(zhǔn)清單見(jiàn)表5,。
表5 ISO/IEC 30113系列標(biāo)準(zhǔn)清單
標(biāo)準(zhǔn)號(hào) | 標(biāo)準(zhǔn)名稱 |
ISO/IEC 30113-1:2015 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面 第1部分:框架 |
ISO/IEC 30113-5:2019 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面 第5部分:手勢(shì)界面標(biāo)記語(yǔ)言(GIML) |
ISO/IEC 30113-11:2017 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第11部分:通用系統(tǒng)操作的單點(diǎn)手勢(shì) |
ISO/IEC 30113-12:2019 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面,。第12部分:通用系統(tǒng)操作的多點(diǎn)手勢(shì) |
ISO/IEC 30113-60:2020 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第60部分:屏幕閱讀器手勢(shì)的通用指南 |
ISO/IEC 30113-61:2020 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第61部分:屏幕閱讀器的單點(diǎn)手勢(shì) |
語(yǔ)音識(shí)別方面,,全國(guó)信標(biāo)委用戶界面分委會(huì)(TC28/SC35)制定了智能語(yǔ)音交互GB/T 36464和GB/T 41813系列標(biāo)準(zhǔn),規(guī)定了智能語(yǔ)音交互系統(tǒng)通用功能架構(gòu),、移動(dòng)智能語(yǔ)音交互系統(tǒng)的術(shù)語(yǔ)定義和系統(tǒng)框架以及要求和測(cè)試方法,。
《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》和《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》都提出要建設(shè)自然語(yǔ)言處理、智能語(yǔ)音,、計(jì)算機(jī)視覺(jué),、生物特征識(shí)別、人機(jī)交互/人機(jī)混合增強(qiáng)現(xiàn)實(shí)等關(guān)鍵技術(shù)標(biāo)準(zhǔn),,推動(dòng)人工智能技術(shù)創(chuàng)新和應(yīng)用,。
3
生成式AI技術(shù)
2024年2月,OpenAI發(fā)布了文生視頻人工智能模型Sora,,引起了廣泛關(guān)注,。OpenAI將ChatGPT所用的Transformer算法,與擴(kuò)散模型相融合,,形成了新的底層算法模型DiT,,使Sora實(shí)現(xiàn)了對(duì)語(yǔ)言的深刻理解,在視頻生成上表現(xiàn)出了很強(qiáng)的“涌現(xiàn)”能力,。
創(chuàng)建豐富和高體驗(yàn)度的虛擬和虛實(shí)結(jié)合內(nèi)容與場(chǎng)景,,需要投入高昂的人力、物力和時(shí)間成本,,極大限制了創(chuàng)新速度和規(guī)模,,是元宇宙發(fā)展的關(guān)鍵瓶頸。生成式AI技術(shù)將為XR的3D模型,、場(chǎng)景,、動(dòng)作和腳本的創(chuàng)建提供前所未有的自由度,讓開(kāi)發(fā)者能夠?qū)W⒂谟脩趔w驗(yàn)創(chuàng)新,,實(shí)現(xiàn)高質(zhì)量XR內(nèi)容,、場(chǎng)景和虛擬世界的快速構(gòu)建。
此外,,XR中的虛擬場(chǎng)景,、人物,需要與用戶進(jìn)行有效的實(shí)時(shí)交互,,提供高度定制化的體驗(yàn)感,。傳統(tǒng)方法只能實(shí)現(xiàn)預(yù)設(shè)式的基本交互功能,而