一種基于圖像的食物信息提供方法
【專利摘要】本發(fā)明公開了一種基于圖像的食物信息提供方法,其通過預先收集食物圖像,建立食物標簽及與該食物標簽相對應的食物信息,并對所述的食物圖像進行標注,接收待識別圖像后,通過對其進行圖像顯著性檢測得到待識別圖像的主體區(qū)域,根據(jù)該主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,最后通過該食物標簽獲取待識別圖像的食物信息;不僅能夠大大提升識別主體對象的正確率,適應各式各樣的構圖,而且僅需通過圖像就能夠獲取食物信息,給用戶帶來極大的便利,為人們的生活健康提供有利的幫助。
【專利說明】一種基于圖像的食物信息提供方法
【技術領域】
[0001]本發(fā)明涉及一種信息處理方法,特別是一種基于圖像的食物信息提供方法。
【背景技術】
[0002]目前,我們在識別圖像中的主體對象主要是提取圖像的最中間位置的圖像來進行識別,但是我們在拍攝時為了使拍攝照片更好看,往往在構圖上采用“黃金分割”,它是廣泛存在于自然界的一種現(xiàn)象,簡單的說就是將攝影的主體對象放在位于畫面大約三分之一處,讓人覺得畫面和諧充滿美感。“黃金分割法”又稱“三分法則”,“三分法則”就是將整個畫面在橫、豎方向各用兩條直線分割成等份的三部分,我們將拍攝的主體放置在任意一條直線或直線的交點上這樣比較符合人類的視覺習慣。拍攝時可直接調(diào)出相機的“井”字輔助線,將拍攝主體放在4個交叉點上,這樣畫面立刻就活了起來。而這樣就導致圖像主體識別的錯誤率居高不下。而健康一直是我們關注的重大問題之一,但大部分對食物的了解有限,有的連名稱都不知道,更無法查詢其相應的信息,因此如何通過拍攝圖像并識別食物主體從而獲取食物的各種相關信息成為我們關注的重點。
【發(fā)明內(nèi)容】
[0003]本發(fā)明為解決上述問題,提供了一種基于圖像的食物信息提供方法,方便快捷,且圖像識別的準確率高。
[0004]為實現(xiàn)上述目的,本發(fā)明采用的技術方案為:
[0005]一種基于圖像的食物信息提供方法,其特征在于,包括以下步驟:
[0006]10.收集食物圖像,建立食物標簽及與該食物標簽相對應的食物信息,對所述的食物圖像進行標注食物標簽并儲存至系統(tǒng)數(shù)據(jù)庫;
[0007]20.接收待識別圖像;
[0008]30.對所述待識別圖像進行圖像顯著性檢測以獲取圖像的顯著性區(qū)域;
[0009]40.計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,得到待識別圖像的主體區(qū)域;
[0010]50.根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,通過該食物標簽獲取待識別圖像的食物信息。
[0011]優(yōu)選的,所述的食物圖像包括:食物外包裝的圖像、食物內(nèi)包裝的圖像、食物真實的圖像、食物的細節(jié)圖像,所述的步驟10中還對收集到的食物圖像進行顯著性檢測以及獲取該食物圖像的主體區(qū)域。
[0012]優(yōu)選的,所述的步驟30中對待識別圖像進行圖像顯著性檢測進一步包括:
[0013]31.提取圖像特征:采用高斯濾波器對待識別圖像進行濾波和采樣,形成以待識別圖像為底層的高斯金字塔模型;然后對高斯金字塔模型中的每一層分別提取各種圖像特征,形成特征金字塔模型;再根據(jù)該特征金字塔模型進行計算得到所述待識別圖像的特征圖;[0014]32.生成顯著圖:把每一個所述的特征圖歸一化處理,并將各個歸一化處理后的特征圖進行綜合計算,得到對應于待識別圖像的顯著圖。
[0015]優(yōu)選的,所述的步驟30中對待識別圖像進行圖像顯著性檢測后生成顯著圖,用白色和黑色對該顯著圖進行標記以獲取圖像的顯著性區(qū)域,其中,白色表示圖像中顯著的區(qū)域,黑色表示圖像中不顯著的區(qū)域。
[0016]優(yōu)選的,所述的步驟40中計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,主要通過標記法對所述顯著圖進行連通區(qū)域的計算和提取,從而得到最大矩形區(qū)域。
[0017]優(yōu)選的,所述的標記法進一步包括:
[0018]41.初始標記值記為I ;
[0019]42.對所述顯著圖進行逐行掃描,找到一個未標記區(qū)域的顏色為白色的像素點,標記該像素點的標記值為I ;
[0020]43.檢查該點的八鄰域的像素點并標記像素點滿足為顏色為白色的像素點且未被標記的標記值為當前標記值,同時將新增的標記像素點記錄下來作為區(qū)域增長的種子點;
[0021]44.在后續(xù)的標記像素點過程中,不斷從記錄種子點的數(shù)組中取出一個種子,實施上述的操作,如此循環(huán),直到記錄種子點的數(shù)組為空;
[0022]45.若一個連通區(qū)域標記結束,則標記值+1,并遍歷下一個連通區(qū)域,直到所有像素點被標記為止;
[0023]46.獲取每個標記值的最大區(qū)域,并將每個標記值為I的白色區(qū)域連接起來,然后計算出顯著性區(qū)域與非顯著性區(qū)域的比例達到最大的矩形區(qū)域為所述的最大矩形區(qū)域。
[0024]優(yōu)選的,所述的食物標簽包括以下標簽的一種或多種:飲料標簽、蛋糕標簽、罐頭標簽。
[0025]優(yōu)選的,所述的食物信息包括以下信息的一種或多種:卡路里含量、脂肪含量、蛋白含量、淡水化合物含量、消化時間。
[0026]優(yōu)選的,所述的步驟50中根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,主要是利用感知哈希算法進行計算,得到數(shù)據(jù)庫中與待識別圖像匹配度最聞的食物圖像。
[0027]本發(fā)明的有益效果是:
[0028]本發(fā)明的一種基于圖像的食物信息提供方法,其通過預先收集食物圖像,建立食物標簽及與該食物標簽相對應的食物信息,并對所述的食物圖像進行標注,接收待識別圖像后,通過對其進行圖像顯著性檢測得到待識別圖像的主體區(qū)域,根據(jù)該主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,最后通過該食物標簽獲取待識別圖像的食物信息;不僅能夠大大提升識別主體對象的正確率,適應各式各樣的構圖,而且僅需通過圖像就能夠獲取食物信息,給用戶帶來極大的便利,為人們的生活健康提供有利的幫助。
【專利附圖】
【附圖說明】
[0029]此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本發(fā)明的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
[0030]圖1為本發(fā)明一種基于圖像的食物信息提供方法的流程簡圖?!揪唧w實施方式】
[0031]為了使本發(fā)明所要解決的技術問題、技術方案及有益效果更加清楚、明白,以下結合附圖及實施例對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0032]如圖1所示,本發(fā)明的一種基于圖像的食物信息提供方法,其包括以下步驟:
[0033]10.收集食物圖像,建立食物標簽及與該食物標簽相對應的食物信息,對所述的食物圖像進行標注食物標簽并儲存至系統(tǒng)數(shù)據(jù)庫;
[0034]20.接收待識別圖像;
[0035]30.對所述待識別圖像進行圖像顯著性檢測以獲取圖像的顯著性區(qū)域;
[0036]40.計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,得到待識別圖像的主體區(qū)域;主要是為了獲取顯著性區(qū)域最大的部分,命為主體區(qū)域,方便接下來的主體對象的識別;
[0037]50.根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,通過該食物標簽獲取待識別圖像的食物信息。
[0038]所述的食物圖像包括:食物外包裝的圖像、食物內(nèi)包裝的圖像、食物真實的圖像、食物的細節(jié)圖像,所述的步驟10中還對收集到的食物圖像進行顯著性檢測以及獲取該食物圖像的主體區(qū)域,以提高步驟50中的相似度匹配的精度。
[0039]所述的步驟30中對待識別圖像進行圖像顯著性檢測進一步包括:
[0040]31.提取圖像特征:采用高斯濾波器對待識別圖像進行濾波和采樣,形成以待識別圖像為底層的高斯金字塔模型;然后對高斯金字塔模型中的每一層分別提取各種圖像特征,形成特征金字塔模型;再根據(jù)該特征金字塔模型進行計算得到所述待識別圖像的特征圖;具體為:先把待識別圖像表示成9層的高斯金字塔,其中第O層是待識別圖像,I到8層分別是用5*5的高斯濾波器對待識別圖像進行濾波和采樣形成的,大小分別為待識別圖像的1/2到1/256,然后對金字塔每一層分別提取各種特征,例如:亮度、紅色、綠色、藍色、黃色、方向等特征,形成特征金字塔,然后再進行計算得到各個特征的特征圖。
[0041]32.生成顯著圖:把每一個所述的特征圖歸一化處理,并將各個歸一化處理后的特征圖進行綜合計算,得到對應于待識別圖像的顯著圖;具體為:對每個特征圖分別用二維高斯差函數(shù)進行卷積,并把卷積結果疊加回原特征圖,使同種特征以側抑制的方式在空間上競爭;卷積和迭代過程進行多次,這樣可以讓少數(shù)幾個最顯著的點均勻分布在整個特征圖上,從而每個特征圖上只保留少數(shù)的幾個顯著點,在疊加多個特征圖時能把多種顯著特征的點突現(xiàn)出來;接下來分別把每一類歸一化后的特征圖逐點求和,得到對應于每一類特征的顯著圖,綜合所有特征的顯著性,就得到對應于待識別圖像的顯著圖。。
[0042]所述的步驟30中對待識別圖像進行圖像顯著性檢測后生成顯著圖,用白色和黑色對該顯著圖進行標記以獲取圖像的顯著性區(qū)域,其中,白色表示圖像中顯著的區(qū)域,黑色表示圖像中不顯著的區(qū)域。
[0043]所述的步驟40中計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,主要通過標記法對所述顯著圖進行連通區(qū)域的計算和提取,從而得到最大矩形區(qū)域。
[0044]所述的標記法進一步包括:[0045]41.初始標記值記為I ;
[0046]42.對所述顯著圖進行逐行掃描,找到一個未標記區(qū)域的顏色為白色的像素點,標記該像素點的標記值為I ;
[0047]43.檢查該點的八鄰域的像素點并標記像素點滿足為顏色為白色的像素點且未被標記的標記值為當前標記值,同時將新增的標記像素點記錄下來作為區(qū)域增長的種子點;
[0048]44.在后續(xù)的標記像素點過程中,不斷從記錄種子點的數(shù)組中取出一個種子,實施上述的操作,如此循環(huán),直到記錄種子點的數(shù)組為空;
[0049]45.若一個連通區(qū)域標記結束,則標記值+1,并遍歷下一個連通區(qū)域,直到所有像素點被標記為止;
[0050]46.獲取每個標記值的最大區(qū)域,并將每個標記值為I的白色區(qū)域連接起來,然后計算出顯著性區(qū)域與非顯著性區(qū)域的比例達到最大的矩形區(qū)域為所述的最大矩形區(qū)域。
[0051]本實施例中,所述的食物標簽包括以下標簽的一種或多種:飲料標簽、蛋糕標簽、罐頭標簽等,例如飲料標簽還可以進一步細分為可口可樂、雪碧等;所述的食物信息主要是指健康信息,本實施例中包括以下信息的一種或多種:卡路里含量、脂肪含量、蛋白含量、淡水化合物含量、消化時間。
[0052]本實施例中,所述的步驟50中根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,主要是利用感知哈希算法進行計算,得到數(shù)據(jù)庫中與待識別圖像匹配度最高的食物圖像。其中,感知哈希算法進行計算的步驟如下:
[0053]①縮小尺寸:
[0054]將圖像縮小到8x8的尺寸,總共64個像素;這一步的作用是去除圖像的細節(jié),只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖像差異。
[0055]②簡化色彩:
[0056]將縮小后的圖像,轉為64級灰度;也就是說,所有像素點總共只有64種顏色。
[0057]③計算平均值:
[0058]計算所有64個像素的灰度平均值。
[0059]④比較像素的灰度:
[0060]將每個像素的灰度,與平均值進行比較;大于或等于平均值,記為I ;小于平均值,記為O。
[0061]⑤計算哈希值:
[0062]將上一步的比較結果,組合在一起,就構成了一個64位的整數(shù),相當于這張圖像的指紋。組合的次序并不重要,只要保證所有圖像都采用同樣次序就行了。
[0063]查找相似度最高的圖像即通過計算兩張圖像的哈希值在各個位置上的距離總和,得到距離總和最低的圖像為與待識別圖像相似度最高的食物圖像。
[0064]本發(fā)明通過收集各種食物相關的圖像,并且為其打上合適的食物標簽,并且將該食物的相關信息記錄起來儲存在系統(tǒng)數(shù)據(jù)庫;接收待識別圖像后,通過對其進行圖像顯著性檢測得到待識別圖像的主體區(qū)域,根據(jù)該主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,最后通過該食物標簽獲取待識別圖像的食物信息;不僅能夠大大提升識別主體對象的正確率,適應各式各樣的構圖,而且僅需通過圖像就能夠獲取食物信息,給用戶帶來極大的便利,為人們的生活健康提供有利的幫助。
[0065]上述說明示出并描述了本發(fā)明的優(yōu)選實施例,應當理解本發(fā)明并非局限于本文所披露的形式,不應看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文發(fā)明構想范圍內(nèi),通過上述教導或相關領域的技術或知識進行改動。而本領域人員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應在本發(fā)明所附權利要求的保護范圍內(nèi)。
【權利要求】
1.一種基于圖像的食物信息提供方法,其特征在于,包括以下步驟: .10.收集食物圖像,建立食物標簽及與該食物標簽相對應的食物信息,對所述的食物圖像進行標注食物標簽并儲存至系統(tǒng)數(shù)據(jù)庫; .20.接收待識別圖像; .30.對所述待識別圖像進行圖像顯著性檢測以獲取圖像的顯著性區(qū)域; .40.計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,得到待識別圖像的主體區(qū)域; .50.根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,得到相似度最高的食物圖像,并將該食物圖像對應的食物標簽作為待識別圖像的食物標簽,通過該食物標簽獲取待識別圖像的食物信息。
2.根據(jù)權利要求1所述的一種基于圖像的食物信息提供方法,其特征在于:所述的食物圖像包括:食物外包裝的圖像、食物內(nèi)包裝的圖像、食物真實的圖像、食物的細節(jié)圖像,所述的步驟10中還對收集到的食物圖像進行顯著性檢測以及獲取該食物圖像的主體區(qū)域。
3.根據(jù)權利要求1所述的一種基于圖像的食物信息提供方法,其特征在于:所述的步驟30中對待識別圖像進行圖像顯著性檢測進一步包括: 31.提取圖像特征:采用高斯濾波器對待識別圖像進行濾波和采樣,形成以待識別圖像為底層的高斯金字塔模型;然后對高斯金字塔模型中的每一層分別提取各種圖像特征,形成特征金字塔模型;再根據(jù)該特征金字塔模型進行計算得到所述待識別圖像的特征圖; 32.生成顯著圖:把每一個所述的特征圖歸一化處理,并將各個歸一化處理后的特征圖進行綜合計算,得到對應于待識別圖像的顯著圖。
4.根據(jù)權利要求1或3所述的一種基于圖像的食物信息提供方法,其特征在于:所述的步驟30中對待識別圖像進行圖像顯著性檢測后生成顯著圖,用白色和黑色對該顯著圖進行標記以獲取圖像的顯著性區(qū)域,其中,白色表示圖像中顯著的區(qū)域,黑色表示圖像中不顯著的區(qū)域。
5.根據(jù)權利要求4所述的一種基于圖像的食物信息提供方法,其特征在于:所述的步驟40中計算包含所述的顯著性區(qū)域的最大矩形區(qū)域,主要通過標記法對所述顯著圖進行連通區(qū)域的計算和提取,從而得到最大矩形區(qū)域。
6.根據(jù)權利要求5所述的一種基于圖像的食物信息提供方法,其特征在于:所述的標記法進一步包括: .41.初始標記值記為I; .42.對所述顯著圖進行逐行掃描,找到一個未標記區(qū)域的顏色為白色的像素點,標記該像素點的標記值為I ; .43.檢查該點的八鄰域的像素點并標記像素點滿足為顏色為白色的像素點且未被標記的標記值為當前標記值,同時將新增的標記像素點記錄下來作為區(qū)域增長的種子點; .44.在后續(xù)的標記像素點過程中,不斷從記錄種子點的數(shù)組中取出一個種子,實施上述的操作,如此循環(huán),直到記錄種子點的數(shù)組為空; .45.若一個連通區(qū)域標記結束,則標記值+1,并遍歷下一個連通區(qū)域,直到所有像素點被標記為止; .46.獲取每個標記值的最大區(qū)域,并將每個標記值為I的白色區(qū)域連接起來,然后計算出顯著性區(qū)域與非顯著性區(qū)域的比例達到最大的矩形區(qū)域為所述的最大矩形區(qū)域。
7.根據(jù)權利要求1所述的一種基于圖像的食物信息提供方法,其特征在于:所述的食物標簽包括以下標簽的一種或多種:飲料標簽、蛋糕標簽、罐頭標簽。
8.根據(jù)權利要求1所述的一種基于圖像的食物信息提供方法,其特征在于:所述的食物信息包括以下信息的一種或多種:卡路里含量、脂肪含量、蛋白含量、淡水化合物含量、消化時間。
9.根據(jù)權利要求1所述的一種基于圖像的食物信息提供方法,其特征在于:所述的步驟50中根據(jù)所述的主體區(qū)域對待識別圖像與數(shù)據(jù)庫的食物圖像進行相似度匹配,主要是利用感知哈希算法進 行計算,得到數(shù)據(jù)庫中與待識別圖像匹配度最高的食物圖像。
【文檔編號】G06K9/46GK104021207SQ201410273492
【公開日】2014年9月3日 申請日期:2014年6月18日 優(yōu)先權日:2014年6月18日
【發(fā)明者】張偉, 傅松林, 李志陽, 張長定 申請人:廈門美圖之家科技有限公司