AI感知分析
進(jìn)而對自身的決策進(jìn)行優(yōu)化,從而擁有專家級別的實力,輔助人類做出決策。 目前聽到在做認(rèn)知智能的企業(yè)非常少。
AI感知分析
圖像識別
面部識別
語音識別
語音信號處理
OCR
圖像識別主要基于圖像特征點的提取與匹配,是AI視覺的重要部分。我司依靠自主研發(fā)的深度學(xué)習(xí)算法和相關(guān)產(chǎn)品,通過數(shù)據(jù)訓(xùn)練可以對前端圖像數(shù)據(jù)進(jìn)行高精度實時識別分析。技術(shù)主要應(yīng)用于圖像對比、圖像跟蹤、安全監(jiān)測等方面。
面部識別基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。我司依靠自主研發(fā)的深度學(xué)習(xí)算法和相關(guān)產(chǎn)品擁有全面自研的人臉信息分析能力,包括人臉檢測與矯正,屬性識別,人臉比對和搜索,多模態(tài)活體檢測等;針對性優(yōu)化復(fù)雜光照和遮擋場景,支持戴口罩人臉識別通行。
語音識別(Automatic Speech Recognition,ASR)主要是將語音轉(zhuǎn)換為文字,利用AI對語音進(jìn)行自動識別和處理的技術(shù)。語音識別主要包括離線語音識別和實時語音識別。通過大量訓(xùn)練數(shù)據(jù)進(jìn)行深度學(xué)習(xí),使得系統(tǒng)能夠識別和理解各種語音信號并進(jìn)行預(yù)處理,剔除噪聲和干擾,提取出有效的語音特征通過語音識別算法將語音信號轉(zhuǎn)化為文本信息。
語音信號處理 (Speech Signal Processing)主要用于分析通過麥克風(fēng)采集語音波形轉(zhuǎn)換的電信號并且可以將模擬電信號轉(zhuǎn)換為其他形式用于語音識別,語音合成和語音編碼等任務(wù),并可直接用于音高提取,共振峰估計,以及表征語音聲學(xué)特征等應(yīng)用。語音信號處理主要應(yīng)用于人機(jī)對話等領(lǐng)域。
光學(xué)字符識別(Optical Character Recognition, OCR)是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進(jìn)行識別,并以文本的形式返回。簡單可以理解為OCR?字識別技術(shù)。主要應(yīng)用于文字、表格、卡片等識別,也包括二維碼等圖像識別。技術(shù)核心是識別準(zhǔn)確率,與軟硬件均有一定關(guān)系。

