本發(fā)明涉及機器人技術領域,特別涉及一種基于人臉識別和語音控制的智能機器人。
背景技術:
隨著機器人行業(yè)的迅速發(fā)展和人工智能的興起,越來越多的研究人員開始投入機器人的研究,服務機器人方興未艾,其中迎賓機器人是服務機器人的主力軍。大型展覽館、會展中心、高級賓館、銀行、醫(yī)院、大型酒店和餐飲機構都出現(xiàn)了各式各樣的迎賓機器人,但目前的迎賓機器人大多功能單一,技術低端,發(fā)展很不完善。不是缺少人臉識別功能,或者語音識別極易受外界嘈雜環(huán)境的影響,就是不具備語音控制機器人復雜動作和及其運動規(guī)劃的功能,而且目前很多的迎賓機器人不具備與客戶進行互動溝通的功能。
因此有必要對現(xiàn)有的迎賓機器人進行改進,以使其具有更多功能,智能化程度更高。
技術實現(xiàn)要素:
有鑒于此,針對現(xiàn)有迎賓機器人存在的不足,本發(fā)明的目的是提供一種智能迎賓機器人,其集語音識別和人臉識別于一體,具有語音控制機器人復雜動作和運動規(guī)劃等功能,以解決現(xiàn)有迎賓機器人功能簡單,智能化程度低等問題。
本發(fā)明基于人臉識別和語音控制的智能迎賓機器人,包括:語音模塊,視覺模塊,語音控制模塊,傳感和避障模塊、以及運動控制模塊;
所述語音語音模塊包括語音輸入模塊、語音識別模塊、對話管理模塊、語音合成模塊和語音輸出模塊;
所述語音輸入模塊用于采集語音信息,并將信息傳輸給語音識別模塊;
所述語音識別模塊用于將接收的語音信息轉換為音波信息,并根據(jù)語音識別規(guī)則對音波信息進行配對處理;語音識別模塊還用于將經(jīng)配對處理后的信息通過命令輸入模塊輸入語音控制模塊,或者將經(jīng)配對處理后的信息輸入對話管理模塊;
所述對話管理模塊對語音識別模塊輸入的信息進行處理,并向語音合成模塊輸入對話信息;
所述語音合成模塊用于對對話管理模塊輸入的信息進行處理,合成應答的語音,并將應答語音輸入語音輸出模塊;
所述語音輸出模塊用于輸出應答語音;
所述視覺模塊包括人臉識別模塊和視覺跟蹤模塊,所述人臉識別模塊用于識別人臉信息,并將識別信息輸入語音控制模塊,所述視覺跟蹤模塊用于對目標物進行實時跟蹤;
所述語音控制模塊用于在接收到語音模塊和視覺模塊輸入的命令信息后,生成機器人動作的目標信息,并將目標信息輸入運動控制模塊;
所述傳感和避障模塊包括障礙檢測模塊和定位信息模塊;
所述障礙檢測模塊用于檢測機器人運動前方的障礙信息,并將障礙信息輸入運動控制模塊;所述障礙檢測模塊包括視覺檢測模塊、超聲波檢測模塊和紅外線檢測模塊;
所述定定位信息模塊用于檢測機器人的坐標信息,并將坐標信息輸入運動控制模塊;所述定位信息模塊包括全局定位信息模塊和局部定位信息模塊,所述全局定位信息模塊為激光傳感器,所述局部定位信息模塊為陀螺儀和光電碼盤;
所述運動控制模塊用于在獲取坐標信息、障礙信息和目標信息后控制機器人的運動。
本發(fā)明的有益效果:
本發(fā)明基于人臉識別和語音控制的智能迎賓機器人,其集語音識別和人臉識別于一體,能通過語音模塊實現(xiàn)人機語音對話,能通過視覺模塊識別顧客,并且能通過語音控制機器人的動作和運動規(guī)劃,跟蹤目標物,智能化程度高。
附圖說明
圖1為迎賓機器人系統(tǒng)結構模塊示意圖;
圖2為語音模塊系統(tǒng)框圖。
附圖標記說明:001-語音模塊,011-語音輸入模塊,012-語音識別模塊,013-對話管理模塊,014-語音合成模塊,015-語音輸出模塊,002-視覺模塊,021-人臉識別模塊,022-視覺跟蹤模塊,003-語音控制模塊,004-傳感和避障模塊,041-障礙檢測模塊,411-視覺測距,412-超聲波組檢測,413-紅外傳感組檢測,042-定位信息模塊,421-全局定位信息模塊,422-局部定位信息模塊,005-運動控制模塊。
具體實施方式
下面結合附圖和實施例對本發(fā)明作進一步描述。
本實施例基于人臉識別和語音控制的智能迎賓機器人,包括:語音模塊001,視覺模塊002,語音控制模塊003,傳感和避障模塊004、以及運動控制模塊005。
所述語音模塊包括語音輸入模塊011、語音識別模塊012、對話管理模塊013、語音合成模塊014和語音輸出模塊015。
所述語音輸入模塊用于采集語音信息,并將信息傳輸給語音識別模塊。
所述語音識別模塊011用于將接收的語音信息轉換為音波信息,并根據(jù)語音識別規(guī)則對音波信息進行配對處理;語音識別模塊還用于將經(jīng)配對處理后的信息通過命令輸入模塊輸入語音控制模塊003,或者將經(jīng)配對處理后的信息輸入對話管理模塊。
所述對話管理模塊對語音識別模塊輸入的信息進行處理,并向語音合成模塊012輸入對話信息。
所述語音合成模塊012用于對對話管理模塊輸入的信息進行處理,合成應答的語音,并將應答語音輸入語音輸出模塊。
所述語音輸出模塊用于輸出應答語音。
所述視覺模塊包括人臉識別模塊021和視覺跟蹤模塊022,所述人臉識別模塊用于識別人臉信息,并將識別信息輸入語音控制模塊003,所述視覺跟蹤模塊用于對目標物進行實時跟蹤。本實施例中,視覺跟蹤模塊022采用現(xiàn)有技術中的camshift算法實現(xiàn)對目標的跟蹤。
所述語音控制模塊003用于在接收到語音模塊001和視覺模塊002輸入的命令信息后,生成機器人動作的目標信息,并將目標信息輸入運動控制模塊005。
所述傳感和避障模塊004包括障礙檢測模塊041和定位信息模塊042。
所述障礙檢測模塊041用于檢測機器人運動前方的障礙信息,并將障礙信息輸入運動控制模塊005;所述障礙檢測模塊包括視覺檢測模塊411、超聲波檢測模塊412和紅外線檢測模塊413;
所述定位信息模塊042用于檢測機器人的坐標信息,并將坐標信息輸入運動控制模塊005;所述定位信息模塊包括全局定位信息模塊421和局部定位信息模塊422,所述全局定位信息模塊為激光傳感器,所述局部定位信息模塊為陀螺儀和光電碼盤。
所述運動控制模塊005用于在獲取坐標信息、障礙信息和目標信息后控制機器人的運動。具體的,本實施例中運動控制模塊005采用現(xiàn)有技術中的局部路徑規(guī)劃算法和虛擬尋跡算法控制機器人的運動,實現(xiàn)機器人的路徑規(guī)劃,自主定位導航與跟蹤控制、以及動態(tài)避障。
最后說明的是,以上實施例僅用以說明本發(fā)明的技術方案而非限制,盡管參照較佳實施例對本發(fā)明進行了詳細說明,本領域的普通技術人員應當理解,可以對本發(fā)明的技術方案進行修改或者等同替換,而不脫離本發(fā)明技術方案的宗旨和范圍,其均應涵蓋在本發(fā)明的權利要求范圍當中。