智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

如何用200美元打造一款聽話的能人臉識別的無人機?

來源:網絡

點擊:1358

A+ A-

所屬頻道:新聞中心

關鍵詞: 無人機,人臉識別

         本文作者是Lukas Biewald—CrowdFlower的創始人,Lukas曾被《Inc.》雜志評選為30歲以下杰出企業家。CrowdFlower成立于2009年,是一個按需勞動力的大數據平臺,幫助企業收集培訓數據并進行人機交互機器學習。

        Lukas Biewald畢業于斯坦福大學,獲得數學學士學位和計算機科學碩士學位。Lukas曾任職Yahoo日本搜索團隊主管,之后作為高級數據科學家就職于Powerset,該公司于2008年被微軟收購。    

        深度學習和廉價硬件的探索

    1501136560818059358.png

    早期航空器,1818(來源:維基百科&美國國會數據庫)

        在制造了一個圖像識別機器人后,顯然下一步是制作一個可飛行的版本。于是我決定打造一款能夠進行面部識別并響應語音命令的自動化無人機。

        選擇一款預制無人機

        對無人機進行編程,最難的部分是如何開始,我是從組裝無人機零件開始的。但是幾乎和之前所有DIY項目一樣,自己組裝無人機花了我很多的錢。而且坦白的說,我手工打造的無人機一直沒有穩定飛行過。可以肯定的是,直接購買預制版本才是更加簡單經濟的選擇。

        大多數無人機制造商都聲稱提供API接口,但對于業余愛好者來說并沒有什么明顯的優勢。市面上帶似乎可用的API接口的無人機,大多售價都超過1000美元,這是一個很高的進入門檻。

        經過一些調查以后,我發現了Parrot AR Drone 2.0(見下圖)。我認為對于業余愛好者來說,這是一款理想的機器。它的價格不高,還可以進行編程。你可以選擇花200美元買一臺新機器,但由于很多人買了無人機又從來不使用它們,因此購買一臺二手機器也是個不錯的選擇。在eBay上二手無人機的售價大約是130美元甚至更低。

    1501136568447032442.png

    △我收藏的各類無人機,Parrot AR Drone無人機掛在最左邊

        Parrot AR無人機飛行的穩定性沒有更貴的新款 Parrot Bebop 2.0 好(售價大約550美元),但是Parrot AR提供一個好用的node.js客戶端庫叫做node-ar-drone,很適合在上面進行開發。

        另外一個優勢:Parrot AR無人機很結實。在測試自動化程序的過程中,無論它被撞墻上、家具上、室內植物上和客人身上,他仍然能夠良好的飛行。

        相比給地面機器人編程,給無人機編程最糟的地方是電池續航時間短。一塊電池需要充電幾個小時,才能飛行大約10分鐘的時間。因此我建議多買兩塊備用電池,測試的時候可以循環使用。

        給我的無人機編程

        由于Javascript天生的驅動能力,因此是非常理想的無人機編程語言。相信我,無人機飛行中會遇到很多異步事件。我雖然沒有在Node上花費很多時間,但這個語言讓我印象深刻。我最近一次認真的為機器人編程使用的是C語言。用C語言處理線程和各種異常是十分痛苦的,因此最好少用。我希望有人為其它無人機平臺建立Javascript開發包,因為這個語言讓我們處理不確定性的開發事件,變得簡單有趣。

        架構

        我決定在筆記本電腦上運行邏輯,在云端進行機器學習。比起直接在樹莓派硬件上運行神經網絡,這種架構的延遲更低。我認為這種架構對目前的業余無人機開發項目來說是可行的。

        微軟、谷歌、IBM和亞馬遜都有快速、廉價的云端機器學習API。最終,我選擇了微軟認知服務API(Cognitive Service API)。因為這是唯一一個提供定制面部識別功能的API。

    1501136582596090502.png

    △無人機的架構

      

      入門

        默認情況下,Parrot AR Drone2.0帶有可供客戶端連接的無線網絡。這個功能對編程者來說非常麻煩。每次你希望嘗試什么的時候,需要先斷開你的網絡然后連上無人機的網絡。幸運的是,有一個名叫ardrone-wpa2的項目非常有用。它可以通過腳本讓無人機加入你自己的WiFi網絡。

        遠程登錄到無人機是件十分有趣的事。Parrot運行在一個剝離版本的Linux上。你最近一次使用遠程登錄功能是什么時候?連接了什么東西?以下是打開終端并直接登錄無人機的示例。

    1501136186231089174.png

        用命令行模式飛行

        安裝node庫以后,創建一個node.js REPL(Read-Evaluate-Print-Loop)并用它引導無人機:

    1501136627727077758.png

        如果你一直跟著做到這步,那么現在你的無人機肯定已經摔過至少幾次了。我上千次重新粘貼了安全殼,直到它徹底損壞,不得不買一個新的。我猶豫要不要提這個,實際上Parrot AR在不安裝安全殼的情況下飛得更好。但無人機在沒有安全殼的情況下更加危險,因為當無人機撞上什么東西時,螺旋槳可能會折斷,而且會在家具上留下痕跡。

        通過網頁控制飛行

        為無人機構建基于web的操作界面并不困難,而且結果令人滿意(見下圖)。使用Express.js框架可以輕松的構建一個漂亮的web服務器。

    1501136640113045904.png

        我設置了一個按鈕來實現AJAX請求。

    1501136651486097274.png

        從無人機上獲得視頻流

        我發現使用無人機攝像頭發送反饋的最佳方法是打開一個連接,并將我的網絡服務器中的PNG連續發送到我的網站。我的網絡服務器使用AR無人機庫從無人機攝像頭中連續拉取PNG圖片。

    1501136667320041652.png

        在無人機圖像上運行人臉識別

        Azure的面部API功能強大且易用。它可以識別你上傳的朋友照片,也可以猜測年齡和性別,我發現這兩個功能的準確率高得令人驚訝。延遲時間約為200毫秒,費用是1.5美元/1,000次。對我開發的這個程序來說,這是完全合理的。下面是關于如何發送一個圖像并進行面部識別的代碼。

    1501136290486029228.png

        我使用ImageMagick庫來注釋PNG圖片中的面孔。在這點上有很多可以擴展的方向,如使用情感API確定面部的情緒等。

        

    運行語音識別控制無人機

        語音識別部分最棘手的不是語音識別本身,而是以微軟的Speech API要求的格式將音頻流從網頁傳輸到本地服務器,最終代碼的大部分是為了實現這個功能。一旦你能夠通過單通道采集到正確頻率的音頻,這個API就可以很好的工作,而且非常容易使用。它的價格是4美元/1000次請求,這對于業務愛好者的應用來說,基本上算是免費的。

        RecordRTC有一個很好的庫,這是客戶端網絡音頻錄制的好起點。在客戶端上,我們可以添加代碼來保存音頻文件:

    1501136361715014839.png

        我使用FFmpeg程序減少音頻采樣點,并將其合并為一個通道,上傳到微軟:

    1501136682936084015.png

        自主搜索路徑

        我用ardrone-autonomy庫為我的無人機繪制自動尋徑地圖。在無人機無數次墜落在客廳的家具和植物上后,我妻子好心的建議我把我的項目搬到車庫里去。那里沒有太多可破壞的東西了,但也沒有太多的空間(見下圖)。

    1501136596543045888.png

    △在我的“實驗室”里試飛無人機

        如果我能獲得更大的實驗空間,我會繼續研究智能搜索算法。但現在我只需要讓我的無人機能夠起飛、旋轉,去尋找我的朋友和敵人:

    1501136716756052924.png

        小結

        一旦建立好一切,你可以通過API控制無人機視頻源,無人機編程就變得非常有趣。伴隨著新的圖像識別技術,給我們提供了各種應用的可能,無論從觀察地面植物到在墻壁上作畫。Parrot無人機不是為在室內小空間飛行設計的,一個價格更高的無人機能讓整個應用變成現實。最終,無人機會變得更加穩定,現實世界中將出現大量類似的應用。

        微軟的認知服務云API易于使用而且價格便宜。首先,我擔心無人機的異常廣角攝像頭會影響面部識別,而無人機螺旋槳的噪音會干擾語音識別。但總體來說,表現要好于預期。延遲問題也不像我所擔心的那樣。使用云計算處理實時圖像流看起來似乎是個奇怪的架構,但它可能是許多應用的未來之路。


    (審核編輯: 林靜)

    聲明:除特別說明之外,新聞內容及圖片均來自網絡及各大主流媒體。版權歸原作者所有。如認為內容侵權,請聯系我們刪除。

    主站蜘蛛池模板: 石家庄UPS_石家庄UPS电源_石家庄广亚电子科技有限公司 | 合肥固化地坪-安徽耐磨地坪-合肥环氧地坪厂家-安徽玉平地坪工程有限公司 | 上海品牌设计公司|品牌策划公司|包装设计公司|上海全案LOGO设计VI设计-木马品牌设计 | 网站建设|营销型网站|独立站搭建|外贸网站建设|wordpress独立站|小程序开发-?无双建站? | 泊头市鸿海泵业有限公司--导热油泵,高温油泵,沥青保温泵,圆弧泵,齿轮油泵,高粘度泵,自吸离心油泵,罗茨油泵为主的专业生产厂家 | 科衣洛定制衣柜,书柜,厨柜,衣帽间,电视柜,酒柜,餐厅柜,门厅柜,鞋柜——科衣洛全屋定制官网 | 晶圆盒垫纸|铝线棒精益管|防静电接地系统工程-上海德拉电子科技有限公司 | 新房_二手房_别墅_全包装修-天美艺装饰【官网】-深圳装修公司 | 军用笔记本电脑_三防加固笔记本电脑_平板型全坚固计算机-集海卫通 | 热电偶_电磁流量计_温度传感器_涡轮流量计_铠装PT100_压力变送器-中瑞能 | 南通出国劳务公司-如东海外经济技术合作有限公司-启东,海门,如皋,海安出国劳务 | 航星洗涤机械有限公司_洗脱机_烘干机_烫平机_折叠机| 久久91精品久久91综合_国产亚洲自拍一区_国产精品第1页_亚洲高清视频一区_91成人午夜在线精品_亚洲国产精品网站在线播放_亚洲国产成人久久综合区_国产精品亚洲专区在线观看_免费视频精品一区二区三区 | 上海况胜_玻璃反应釜厂家_双层玻璃反应釜_实验室玻璃反应釜 | 童程童美少儿编程培训课程 - 上市公司缔造少儿编程专业化品牌20年 | 中国国际精细化工展览会—官网 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 江苏工业双氧水_工业亚硝酸钠的作用与用途_工业双氧水厂家-江苏连云港嘉一化工厂 | 弯箍机_钢筋弯箍机_全自动钢筋弯箍机_数控弯箍机-建科智能装备制造(天津)股份有限公司 | 铝合金线棒生产厂家-提供第三代精益管,防静电工作台定制与批发-宁波杰艾逖仓储设备有限公司 | 截止阀,电动,气动,手动,化工截止阀-上海申弘阀门有限公司 | 卧螺离心机-固液分离机-台州春鼎机械制造有限公司 | 威海实木家具-威海定制家具-威海家具-威海至佳百隆家具有限公司 威海木箱,威海木托盘,威海免熏蒸包装箱-威海耀晟木制品有限公司 | 临沂网站建设,临沂网站制作,临沂网络公司,临沂小程序开发,临沂网站设计,沂水网站建设,沂南网站建设,蒙阴网站建设,平邑网站建设,费县网站建设,兰陵网站建设,郯城网站建设,临沭网站建设,莒南网站建设,兰山网络公司 | 智能门锁管理-公寓管理软件-智能水电表管理系统-深圳安安智能 | 自恢复保险丝_贴片保险丝_插件保险丝_力特保险丝_力特经销商_SMD贴片保险丝_一次性保险丝厂家—深圳市集电通实业有限公司 | 专注客流统计,客流分析,人流统计系统,客流计数器-广州市天威电子科技有限公司 | 三氯异氰尿酸_二水二氯异氰尿酸钠_氰尿酸 | 精品中文字幕在线观看,粉嫩av一区二区三区,最近中文字幕在线看免费视频,亚洲高清在线观看,日本一区二区视频手机免费看,国产黄色小视频,亚洲高清免费视频,国产精品一区二区欧美视频,亚洲人免费视频,亚洲视频在线观看免费,国产免费高清综合视频,中文字幕永久在线 | 喷涂机器人|自动喷涂生产线|自动喷涂设备|自动化生产线-深圳市荣德机器人科技有限公司 | 住友套管总代理-日本住友套管-住友热缩管-上海弘奇电子科技有限公司 | 网带烘干机-不锈钢网带-乙型网带-不锈钢链板-网带输送机-宁津县天惠机械制造有限公司 | 企业宣传片制作公司-广告宣传片拍摄-专题片,tvc广告制作-拍摄微电影影视公司-艺虎文化 | 智能化会议系统|多媒体会议系统|无纸化会议系统|会议音箱|高清视频会议终端|智能化会议室|会议系统|视频会议系统-深圳市航视达科技有限公司 | 污水处理设备-污泥脱水设备-纯水净水设备-山东善丰机械科技有限公司 | 首页|YULI玉立专业厨房电器官网|集成灶十大品牌 油烟机 燃气灶 | 真空烘箱-高低温试验箱-防爆烘箱-防爆高低温试验箱-老化房-恒温恒湿箱-高低温试验箱-高低温冲击试验箱厂家—上海标承实验仪器有限公司 | 山东淄博海杰化工有限公司-淄博海杰化工_NP-10、OP-10、吐温80、司盘80、磺酸、油酸等乳化剂 | 楼宇门厂家-氟碳漆门-不锈钢大门-单元门-锌合金大门-永康市龙卫门业 | 河北省建筑科学研究院有限公司| 天津印刷_天津印刷厂_天津印刷公司_天津包装盒厂家_天津包装盒印刷厂_七层共挤膜厂家_彩色印刷_画册印刷_礼品盒定做 _七层共挤膜_食品真空袋-欢迎访问嘉联包装官网! |