在剛剛結(jié)束的首屆騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊宣布在智慧農(nóng)業(yè)領(lǐng)域的最新進(jìn)展:國際上與歐洲頂級(jí)農(nóng)業(yè)大學(xué)WUR聯(lián)辦第二屆“國際智慧溫室種植大賽”,國內(nèi)與中國農(nóng)科院信息所成立智慧農(nóng)業(yè)聯(lián)合實(shí)驗(yàn)室。
騰訊副總裁姚星在揭牌式上表示,“自去年底騰訊AI Lab 牽頭研發(fā)的iGrow算法在首屆溫室種植大賽上收獲豐盛,我們一直在大力推進(jìn)前沿科技與農(nóng)業(yè)的跨界研究。騰訊集團(tuán)也已相繼與中糧集團(tuán)、廣東粵旺農(nóng)業(yè)集團(tuán)、深圳壹家倉、仲愷農(nóng)業(yè)工程學(xué)院等簽訂戰(zhàn)略合作協(xié)議,開展智慧農(nóng)業(yè)深度合作。今天我們又有了一位新伙伴,騰訊將攜手中國農(nóng)科院農(nóng)業(yè)信息研究所,借助信息所在農(nóng)業(yè)領(lǐng)域深厚的積累整合騰訊在AI等前沿科技的實(shí)力,成立智慧農(nóng)業(yè)聯(lián)合實(shí)驗(yàn)室,繼續(xù)探索前沿科技和農(nóng)業(yè)的跨領(lǐng)域研究,共同助力產(chǎn)業(yè)升級(jí)!”
中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所所長孫坦表示,未來,智慧農(nóng)業(yè)聯(lián)合實(shí)驗(yàn)室將著力探索以下兩個(gè)方面:
一、結(jié)合現(xiàn)有積累及國情,在可控環(huán)境下,開發(fā)通用人工智能種植解決方案,推動(dòng)產(chǎn)業(yè)升級(jí)與中國智慧方案自主研發(fā);
二、以算法為基礎(chǔ),整合雙方在技術(shù)和農(nóng)業(yè)知識(shí)上的優(yōu)勢(shì),聯(lián)動(dòng)IoT、機(jī)器人、計(jì)算機(jī)視覺等能力,尋找前沿科技與現(xiàn)代農(nóng)業(yè)的結(jié)合點(diǎn),協(xié)同開展原始創(chuàng)新。
AI分論壇上,騰訊AI Lab“AI+農(nóng)業(yè)”業(yè)務(wù)負(fù)責(zé)人羅迪君介紹了團(tuán)隊(duì)在首屆智慧溫室種植大賽中的經(jīng)驗(yàn)以及在農(nóng)業(yè)AI領(lǐng)域的技術(shù)探索。以下是演講內(nèi)容分享:
從硅到碳:AI如何助力智慧農(nóng)業(yè)
——騰訊AI Lab“AI+農(nóng)業(yè)”業(yè)務(wù)負(fù)責(zé)人羅迪君

首先介紹一下這個(gè)題目,碳基文明和硅基文明是科幻小說中的概念。這里想借用這個(gè)概念,硅是半導(dǎo)體最重要的組成元素,也是運(yùn)行人工智能算法的計(jì)算機(jī)中最重要的組成部分。在這項(xiàng)探索當(dāng)中,騰訊AI Lab創(chuàng)新性地把依賴硅而存在的人工智能遷移作用到以碳為主要元素的農(nóng)作物上,讓農(nóng)作物更智能地生長,消耗盡量少的資源,獲得更多的食物,試圖解決一些人類將來可能面臨的全球性挑戰(zhàn)問題。

在由荷蘭瓦赫寧根大學(xué)(WUR)舉辦的首屆溫室種植大賽中,我們獲取了AI策略第一名,總分第二名的成績(jī),平均產(chǎn)量是24公斤每平方米每季度,超出國內(nèi)水平6倍,媲美擁有20年黃瓜種植經(jīng)驗(yàn)的頂級(jí)專家。
農(nóng)業(yè)AI系統(tǒng)的構(gòu)建和訓(xùn)練方法

基于同樣的理由,為了突破農(nóng)業(yè)技術(shù)的局限性,我們希望構(gòu)建出一種用于開發(fā)農(nóng)業(yè)技術(shù)的創(chuàng)新工具。首先,我們構(gòu)造了一個(gè)和真實(shí)溫室盡量接近的仿真系統(tǒng),通過仿真的傳感器和控制器訓(xùn)練AI,通過大量的訓(xùn)練得到一個(gè)控制策略,當(dāng)控制策略收斂后,再把AI放回一個(gè)真實(shí)的溫室當(dāng)中,通過同樣的傳感器和控制器進(jìn)行全自動(dòng)閉環(huán)控制。
具體學(xué)習(xí)框架是:首先,AI根據(jù)當(dāng)前狀態(tài)作出一個(gè)決策,環(huán)境就會(huì)根據(jù)不同的決策演變到下一個(gè)狀態(tài),同時(shí)給AI一個(gè)獎(jiǎng)勵(lì),AI根據(jù)新的狀態(tài)做出決策,以獲得盡量多的獎(jiǎng)勵(lì)。如此類推,AI通過不停地和環(huán)境交互來進(jìn)行學(xué)習(xí)。這個(gè)環(huán)境可以是一個(gè)真實(shí)的物理環(huán)境,也可以是一個(gè)計(jì)算機(jī)仿真的環(huán)境。因?yàn)橛?jì)算機(jī)的成本越來越低,計(jì)算能力越來越高,在仿真環(huán)境下進(jìn)行AI的訓(xùn)練變得高效而低成本。
這個(gè)算法的核心是通過極低的傳感器成本訓(xùn)練出一個(gè)優(yōu)秀的AI控制器。首先,我們減少氣候傳感器的數(shù)目,但同時(shí)增加了農(nóng)業(yè)專家知識(shí)作為強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)回報(bào)的一個(gè)因素。具體公式如下圖,小寫r代表凈利潤。在優(yōu)化過程中,有三類初始狀態(tài),包括莖密度、留果策略和留葉策略都設(shè)置為靜態(tài)參數(shù)進(jìn)行優(yōu)化。

AI從仿真系統(tǒng)遷移到真實(shí)溫室的過程和挑戰(zhàn)

如何把AI從仿真系統(tǒng)遷移到真實(shí)溫室呢?在首屆國際人工智能溫室種植大賽中,我們種植的作物是黃瓜。在仿真器中,我們每次都仿真黃瓜約6個(gè)月的生長過程,記錄AI每次的動(dòng)作,各種資源的消耗,包括水、電、二氧化碳等,以及黃瓜的收成情況,這樣AI就知道怎樣的決策會(huì)獲得怎樣的獎(jiǎng)勵(lì)。通過不停地探索和學(xué)習(xí),AI也在不斷優(yōu)化自己的決策網(wǎng)絡(luò)和各種靜態(tài)參數(shù)。在探索學(xué)習(xí)中,我們會(huì)引進(jìn)很多隨機(jī)決策,所以AI能尋找出一些超越人類知識(shí)的決策。當(dāng)探索和學(xué)習(xí)逐漸收斂后,我們就把同樣的決策網(wǎng)絡(luò)和靜態(tài)參數(shù)直接部署到真實(shí)的自動(dòng)溫室中進(jìn)行種植。

從仿真到真實(shí)溫室種植是非常有挑戰(zhàn)的。首先,仿真器會(huì)盡量接近真實(shí)溫室的物理模型,但模型總是有精度誤差,導(dǎo)致了仿真溫室中的最優(yōu)種植策略,很有可能不是真實(shí)溫室中的最優(yōu)策略。
第二,由于是比賽環(huán)境,只能控制黃瓜從出生到死亡的一次生長過程。仿真環(huán)境下,我們可以不停地嘗試種植策略,出了問題就再做一次,但真實(shí)的溫室中,出了問題就無法回頭了。還有,溫室的控制策略和黃瓜的收成之間有延遲效應(yīng),也就是說,如果溫室的控制策略出了問題,會(huì)延遲一段時(shí)間才能被感知到,這可能導(dǎo)致AI感知到問題的時(shí)候,才發(fā)現(xiàn)之前的控制錯(cuò)誤是災(zāi)難性的。最后,真實(shí)溫室的傳感器、控制器總是存在噪聲的,這些真實(shí)的噪聲是很難通過仿真器模擬出來,仿真器和真實(shí)溫室之間的差異,會(huì)導(dǎo)致決策網(wǎng)絡(luò)的誤差。

上圖是在真實(shí)溫室中我們主要的傳感器和控制器。在真正種植前,我們進(jìn)行了超過三萬次的實(shí)驗(yàn),超過一萬五千年的種植經(jīng)驗(yàn)。

左圖是我們的成本和收入隨時(shí)間變化的曲線,右邊是靜利潤曲線。最初兩周左右的凈利潤是負(fù)的,因?yàn)檫@時(shí)我們一直在消耗資源,溫室也在折舊,卻沒有黃瓜收成。大概從第三周開始有黃瓜收成,于是虧損逐漸縮小。從大概40天左右開始轉(zhuǎn)虧為盈,最后的凈利潤是大概每平方米20歐元左右。我們最后的凈利潤和荷蘭最優(yōu)秀的人類種植專家?guī)缀跻粯樱@得了更好的二氧化碳效率,我們也獲得了這次比賽的AI策略冠軍。
AI的優(yōu)勢(shì)和未來發(fā)展

我們的AI在設(shè)計(jì)階段就具有終身學(xué)習(xí)能力。這里展示的是我們的AI如何通過和仿真器以及真實(shí)溫室的交互過程進(jìn)行終身學(xué)習(xí)。首先,我們進(jìn)行決策網(wǎng)絡(luò)的初始化,然后在某一個(gè)版本的仿真器中進(jìn)行學(xué)習(xí),學(xué)習(xí)收斂后放入真實(shí)溫室進(jìn)行繼續(xù)學(xué)習(xí)。如果后續(xù)再建立一些更好版本的仿真器,那么這個(gè)決策網(wǎng)絡(luò)可以繼續(xù)進(jìn)行學(xué)習(xí)和迭代,迭代的結(jié)果也可以放入多個(gè)真實(shí)溫室中繼續(xù)學(xué)習(xí)。每次的學(xué)習(xí)都會(huì)讓決策網(wǎng)絡(luò)的性能進(jìn)一步提高。

在這次的實(shí)際操作中,我們努力減少了傳感器成本,產(chǎn)生了可觀的凈利潤,但總成本還有進(jìn)一步降低的空間。如黃瓜苗的移植、剪葉、摘瓜等人工成本還不夠標(biāo)準(zhǔn)化,對(duì)于批量化溫室生產(chǎn)來說還有一些困難,我們正在想辦法將這些成本降低。另外,進(jìn)一步提高仿真器的精度也是我們下一步的目標(biāo)之一。最后,我們正在開發(fā)更有彈性的算法,使得在種植過程中,能以很低的學(xué)習(xí)成本從一種作物遷移到其他作物。
謝謝大家!
來源:騰訊科技