【2016年第1期】农业大数据研究生培养模式探索
牟少敏,溫孚江,宋長青
山東農業大學農業大數據研究中心,山東 泰安 271018
摘要:大數據應用尚處于初級階段,農業大數據又是多學科的交叉融合產物,相應人才的缺乏是其研究和應用的重要瓶頸。簡要介紹了農業大數據的概念、處理技術及其應用。并結合農業大數據的特點,針對目前人才嚴重缺乏的現狀,提出了農業大數據研究生培養的重要性,并在此基礎上,探討了培養方案的要素以及人才培養模式。
關鍵詞:農業大數據;機器學習;大數據處理技術;研究生培養模式
中圖分類號:G 643 ?????文獻標識碼: A
doi: 10.11959/j.issn.2096-0271. 2016006
Training mode of graduate students majored in agricultural big data
MU Shaomin, WEN Fujiang, SONG Changqing
Agricultural Big Data Research Center, Shandong Agricultural University, Taian 271018, China
Abstract: Big data application is still in its primary stage, and agricultural big data is the integrated products of many different subjects, so the insufficiency of big data specialists or experts is an important bottle-neck of big data application. The concept of agricultural big data, the processing technology and its application were briefly introduced. Combining the characteristics of the agricultural big data, aiming at the situation of agricultural big data talent lack, the importance of graduate students majored in agriculture big data was discussed. On this basis, the essence of training scheme and the training mode of graduate students were discussed.
Key words: agricultural big data, machine learning, big data processing technology, training mode of graduate students
?
1? 引言
自2008年國際綜合性期刊《Nature》發表有關大數據(big data)的??詠?#xff0c;大數據的采集、存儲、挖掘、處理、分析和利用,已成為我國各行業和科學研究關注的焦點。全球IT、互聯網巨頭都已經意識到數據的重要性,包括EMC、IBM、惠普、微軟和阿里巴巴等大型IT企業都紛紛通過收購和建立相應的大數據研發機構等手段實現技術整合。人們進入了一個“數據為王”的時代。
我國政府、高等院校、科研院所和各個行業都認識到信息科技時代大數據技術和應用的重要性,其發展將成為我國應對經濟全球化、加快經濟結構調整、培育新的經濟增長點的催化劑。目前,我國不僅對數據共享、數據處理和數據安全等迫切需要解決的問題進行了頂層設計,而且對大數據的技術參考模型、數據交易平臺交易數據描述、數據能力成熟度評價模型、數據質量評價指標等有關標準的制定也在加緊進行中,其必將為大數據的可持續發展提供強有力的保障。
農業大數據指的是來源廣泛、類型多樣、結構復雜、具有潛在價值,并難以應用通常方法處理和分析的數據集合[1],具有農業地域性、季節性、多樣性、周期性、準公益性等特點。目前,農業大數據在我國已經取得了初步的應用。利用地理信息系統(geographic information system,GIS)、遙感和機器學習(machine learning,ML)等技術,對小麥和玉米等農作物病蟲害的數據進行分析,并對其發生程度進行預測預警。農產品檢測信息已成為消費者追溯產品最直觀、最可信的信息[2]。利用物聯網和數據庫等技術,實現農產品檢測數據的整合,進行農產品質量安全溯源。采用O2O(online to offline)電商模式,使互聯網成為線下交易的前臺,將農產品的線上交易與線下服務相結合,大大節省了農產品的交易成本。在我國經濟進入新常態的背景下,互聯網+農村金融也受到了人們的廣泛關注。農業大數據可以當好政府的智囊,為企業提供支撐,為學科提升和轉型提供平臺,為提高管理水平提供手段[3]。
由以上分析可以看出,大數據廣闊的應用前景需要大量的大數據人才。2018年美國需要44萬~49萬名大數據深入分析人才,存在14萬~19萬名的人才缺口;需要400萬名具備基于大數據分析進行決策的經理和分析師,這一類人才缺口在2018年將達到150萬人[4]。而我國系統和專業培養農業大數據人才的機構和單位基本沒有,從事農業大數據的人才更是非常缺乏,甚至是農業大數據發展的一個短板。
目前,我國農業大數據人才的主要來源是農業信息化的人才,農業信息化人才本身就存在數量嚴重不足的問題。同時,農業信息化人才主要是來自農學類專業、計算機類專業和經濟管理類專業等。這些專業培養人才的專業針對性強,知識面不廣,而既具有農業基本知識又掌握大數據技術的人才則是少之又少,如果不加快培養復合型的人才,將會制約農業大數據的發展。
我國農業大數據的研究和應用可以視為一個非常巨大和復雜的系統工程。農業生產過程中,多年積累的數據是許多領域無法比擬的,它具有大量、高維、動態、不完全(缺值)、不確定(數據中的系統或隨機噪聲)和稀疏性(很少甚至沒有有用的記錄)等特性。只有將機器學習、深度學習和自然語言的理解等人工智能技術、云計算技術、Hadoop等大數據處理技術和農業領域進行深度融合,農業大數據才能產生巨大的效益。因此,未來農業大數據的人才需求必然呈現出爆發性增長,農業大數據研究生人才必然會成為最炙手可熱的人才,如何突破目前國內農業大數據領域人才需求的瓶頸以及對人才培養戰略的積極布局,加速其培養,顯得尤為重要。
近年來,山東農業大學在農業大數據的研究和應用方面取得了一定的成績,在經過深入調研和基礎上,率先將農業大數據人才培養納入了研究生培養體系,設立了大數據科學與技術研究生研究方向,下面重點探討一下農業大數據研究生人才培養的新模式。
?
2? 農業大數據研究生人才培養必要性、可行性及其模式
2.1 ?農業大數據研究生人才培養的必要性與可行性
汪洋副總理指出“用發展新理念大力推進農業現代化”,而農業現代化的發展需要物聯網、大數據和云計算等技術,需要大量的農業大數據人才,因此農業大數據研究生人才的培養是一項非常必要和迫切的工作。
大數據時代賦予了農業大數據研究生人才培養特殊意義,是非單一學科所能完成的,需要多元化的培養體系,需要跨界和多學科的深度融合。山東農業大學是一所多學科的農業院校,既有農業相關學科,也有計算機科學與技術和信息科學等學科,在農業大數據研究生人才培養方面具有跨界和多學科深度融合的優勢和基礎。
目前,國內設置大數據研究生人才培養的狀況如下:2014年中國人民大學、北京大學等5所大學聯合培養大數據分析研究生,首批招生50名,5所高校還將共同組建大數據分析研究生培養協同創新平臺。香港中文大學設立數據科學與商業統計(data science & business statistics)研究生課程,紐約大學上海分校設立商業數據分析科學(master of science in business analytics)研究生課程。北京航空航天大學、清華大學等高校也啟動了大數據項目,培養相關人才。上海復旦大學自設了數據科學本科專業。
但是,針對農業大數據的研究生人才培養還未見報道,山東農業大學的農業大數據研究生第一期實驗班2016年開始招生,計劃招生人數30~50人。
2.2 ?農業大數據研究生人才培養模式
國務院促進大數據發展行動綱要指出:“鼓勵高校設立數據科學和數據工程相關專業,重點培養專業化數據工程師等大數據專業人才。鼓勵采取跨校聯合培養等方式開展跨學科大數據綜合型人才培養?!边@為農業大數據研究生人才培養模式指明了方向。針對農業大數據的特點,使計算機科學與技術、信息與計算科學、統計學與經濟金融、生命科學、資源與環境、農學、園藝科學與工程和植物保護等眾多學科領域相互滲透,深度交叉,建立跨學科、跨領域的師資隊伍和研發團隊,開展農業大數據研究生人才培養工作。
研究生培養模式指的是在一定的現代教育理論、教育思想指導下,按照特定的培養目標和人才規格,以相對穩定的教學內容和課程體系、管理制度和評估方式,實施研究生教育的過程。下面結合農業大數據研究生人才培養模式的特點,以山東農業大學的農業大數據研究生人才培養模式為例,從以下幾個方面探討如何進行農業大數據研究生人才培養。
2.2.1 農業大數據方向培養目標
針對農業大數據的特點,在充分調研的基礎上,確定了農業大數據方向培養目標。即從數據管理、數據分析、數據應用3個主要應用層面出發,依托農業學科的優勢,強化學科交叉,著重培養學生數據的收集、融合、管理能力,挖掘農業大數據背后價值的能力,成為未來農業大數據等領域具有豐富實踐經驗和能力的實用型大數據人才。
2.2.2 師資隊伍
農業大數據研究生人才培養的關鍵問題之一就是師資隊伍的建設。農業大數據的跨學科、跨領域的特點,決定了其師資隊伍建設需要打破以往傳統的構建模式,需要新思路和新模式。
農業大數據研究生人才培養主要依托信息科學與工程專業的師資力量,同時根據人才培養的需要,聯合相關學科師資力量和領域專家學者力量共同培養。如山東農業大學在涉農、經濟管理、計算數學等學科建設方面具有雄厚的學科基礎,能夠為數據科學與應用學科起到良好的支撐作用。
研究生的培養實行雙導師負責制和導師組相結合的模式。為了強調學科交叉課程學習,完善研究生多學科的知識結構與農業大數據的思維方式,采用了雙導師制。雙導師1名來自本校,另外1名來自其他國內知名大學或國內知名企業。本校導師是研究生培養和管理的第一責任人。由于農業大數據應用會滲透到農業產業鏈的產前、產中和產后的整個過程,這還需要構建以雙導師為中心,多學科導師相輔助的集體指導小組,結合實際科研課題或工程項目進行培養。
2.2.3 人才培養
為了進一步加強人才培養力度,重視科研能力和方法的訓練,還采用與名校、名企聯合培養模式。因材施教,強調自學和對話式、討論式教學,發揮導師和研究生雙方的積極性和創造性。教學方式也有別于傳統的課堂講授,采取案例教學和討論班的方式,或者以團隊的形式共同完成一個項目。同時,聘請國內外知名數據科學和農業等領域的專家教授定期進行講座,不斷擴大對外交流,通過創新培養機制,保障農業大數據研究生人才培養質量。
2.2.4 科學研究
依托山東農業大學信息科學與工程學院、山東農業大數據研究中心和山東省農業大數據產業技術創新戰略聯盟,在農業大數據的科學研究上已經完成了以下工作:利用物聯網技術進行農業數據(如溫度、濕度等)的采集;建立了分布式的存儲數據庫HBase和基于Hadoop的農業數據分析平臺。將采集到的農業相關數據(農業病蟲害等結構化數據以及圖像、文字等非結構化數據)存儲到分布式數據庫中。借助于Hadoop大數據處理平臺將支持向量機等主要的機器學習算法進行并行化數據分析,實現農業數據從存儲到分析的并行化,極大地提高了農業數據處理的吞吐效率和分析準確率,為農業數據的收集存儲分析提供了一種新的處理模式。
充分發揮先期已經取得的數據技術與應用科研優勢,結合國家“十三五”規劃,從數據采集、數據存儲、數據分析與處理技術、數據的可視化等幾個方面入手,加速培養適應農業信息化各方面需要的高層次、多層次的復合型研究生人才。充分發揮山東農業大學農業科學優勢及生命科學特色,充分發揮大數據技術與應用技術的強大功能及優勢,進一步拓寬大數據技術在農業上的應用領域,提高農業數據收集整理分析和決策的科學化。
2.2.5 課程體系與實踐教學
科學合理的研究生課程體系對保障研究生培養質量具有重要作用。緊緊圍繞研究生培養目標,從體現農業大數據的特色出發,構建開放式的研究生課程體系。課程體系主要包括核心課程和專業學位課程。課程學習時間為1年。確定了“農業大數據分析技術基礎”、“數據挖掘”、“機器學習”、“農業信息科學”、“非結構化大數據分析”和“農業大數據案例分析”等必修課程。每門課程不是由一位老師獨立完成,而是由一個課程組各有特長的多位老師共同進行講授。
實踐教學是培養農業大數據創新人才非常重要的一個環節,是合作培養模式的具體體現。研究生在修滿專業規定的學分后,以實際項目為背景,由校企雙方發揮各自的優勢,共同指導農業大數據課題的研究。實習基地是學生實習和社會實踐的重要場所,建立跨學科的研究中心和實驗室,并以如泰山神農智谷農業大數據產業園區作為農業大數據研究生人才的校外實習基地,計劃逐步增加更多的實習基地,使得農業大數據研究生的培養更加貼合學科前沿的發展,更好地滿足國民經濟建設需求。
?
3 ?結束語
大數據時代背景下,如何培養農業大數據的復合型研究生人才無論是在國內還是在國外都沒有先例,數據科學和技術的研究也還處于起步階段。山東農業大學率先在農業大數據研究生人才培養方面進行了相關的探索和研究。農業大數據研究生人才的培養必將是一項長期而艱巨的工作,仍需要不斷地創新、探索和實踐。隨著大數據時代的到來和研究生培養模式的不斷創新和完善,一定能夠培養出高質量的農業大數據研究生人才,服務于我國農業現代化的建設。
參考文獻:
[1] 趙璞. 淺談農業大數據[EB/OL].[2015-01-11]. http://www.caas.net.cn/zt/kxjd1/250773.shtml.
ZHAO P. Discussion on agricultural big data[EB/OL].[2015-01-11]. http://www.caas.net.cn/zt/kxjd1/250773.shtml.
[2] 錢建平, 張保巖, 邢斌, 等. 集成實時快速檢測信息的蔬菜追溯系統改進與應用[J]. 農業工程學報, 2015(4): 306-311.
QIAN J P, ZHANG B Y, XING B, et al. Improvement and application of vegetable traceability system with integrated real-time rapid detection of information[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015(4): 306-311.
[3] 溫孚江. 農業大數據研究的戰略意義與協同機制[J]. 高等農業教育, 2013(11):3-6.
WEN F J. Strategic significance and synergetic mechanism of agricultural big data research[J]. Higher Agricultural Education, 2013(11): 3-6.
[4] 何海地. 美國大數據專業碩士研究生教育的背景、現狀、 特色與啟示[J]. 圖書與情報, 2014(2): 48-56.
HE H D. The status and suggestions of American great universities with master’s programs in big data analytics[J]. Library & Information, 2014(2):48-56.
牟少敏(1964-),男,博士,山東農業大學教授,主要研究方向為大數據、機器學習和模式識別。
溫孚江(1955-),男,現任山東農業大學校長、教授,農業大數據創新戰略聯盟理事長,全國人民代表大會常務委員會委員。早年留學美國,并獲得博士學位。主要從事植物保護研究和宏觀農業研究工作。發表論文210余篇,專著5部。最近一本專著《大數據農業》由中國農業出版社于2015年9月出版。目前主要從事農業大數據應用研究工作,是我國農業大數據研究主要發起人之一。
宋長青(1963-),男,山東農業大學教授,農業大數據研究中心常務副主任,主要從事農業大數據采集、入庫、平臺建設、示范基地等研究與示范工作。
總結
以上是生活随笔為你收集整理的【2016年第1期】农业大数据研究生培养模式探索的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何在C++Builder中使用全局变量
- 下一篇: C++ 关键字 (try-finally