ICDAR 2019国际竞赛召开在即,百度联合学界重奖破局者!
素有文檔圖像識別領域“世界杯”之稱的 ICDAR 2019國際權威競賽將于3月1日正式開賽。
獎金總計17400美元!
作為 ICDAR 2019 Robust Reading Competition 競賽主要組織者之一,百度聯合馬來亞大學、華南理工大學、西班牙計算機視覺中心、中國圖象圖形學學會共同發布了兩項極具挑戰的競賽任務:
ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標注大規模街景文字識別競賽)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字識別競賽)。
本次競賽獎金總計17400美元,歡迎國內外學術界、工業界各大機構華山論劍一較高下。
賽事介紹
ICDAR(International conference on Document Analysis and Recognition)是全球文檔圖像分析識別領域公認的權威學術會議,從1991年起每兩年召開一次。
自 2003 年 ICDAR 設立“Robust Reading Competitions”以來,該競賽就成了評測和檢驗自然場景/網絡圖片文本自動提取與智能識別最新技術研究進展的重要國際賽事及標準,競賽中的諸多方法對 OCR 技術發展具有強大推動力。高技術難度、高實際應用性,也使該盛會受到科研院校、科技公司等關注,至今已有 89 個國家的 3500 多支隊伍參與。
2015-2018期間百度多次在 ICDAR 2013、 ICDAR 2015權威競賽集合獲得檢測、識別、端到端各項任務榜單第一,位居業內領先水平。
百度將 OCR 深度學習技術應用于多個業務場景,打造文檔、翻譯、網圖、街景等多場景通用文字識別能力,支持中、英、日、韓、葡、德、法、意、西、俄十國語言。
針對金融、保險、交通等重點場景構建 OCR 產品矩陣和 AI 開放平臺,百度 OCR 打造了領先的證照、票據識別解決方案。針對終端計算場景,百度 OCR 模型壓縮用于多種嵌入式智能設備,OCR 終端 SDK 與多家手機廠商合作,打造領先的視覺終端計算能力。
?ICDAR 2019-LSVT?
?大規模弱標注街景文字識別競賽?
聚焦探索大規模數據場景下深度學習模型算法能力極限,推動大規模弱標注數據下文字識別新方法創新。
ICDAR2019-LSVT 數據集源于百度真實應用場景,作為首個提出弱標注數據的場景文字數據集,包括5萬張精標注街景圖像、40萬張弱標注街景圖像,總計45萬張,數據量是現有公開數據集(ICDAR 2017、ICPR 2018等)的14倍以上。
室外場景文字識別具有廣泛應用場景,例如:拍照翻譯、圖像檢索、街景地標識別、室外場景理解等。
?
▲精標注數據示例
▲弱標注數據示例
?
深度學習算法通常需要大量訓練數據才能在真實應用中取得良好效果,滿足實際場景的應用需求。由于合成數據與真實數據仍存在明顯差異,同時大規模精確數據標注成本高,探索利用大規模弱標注數據提升深度學習算法性能具有重要研究意義和實用價值,同時對探索場景文本識別技術能力邊界具有顯著推動作用。
·?數據集
5萬精標注+40萬張弱標注街景隨拍圖像,大規模數據源于實際應用,包含多種復雜場景
·?兩項競賽任務
文字檢測、端到端文字識別,獎金?$8,700
?
?ICDAR 2019-ArT?
?任意形狀文字識別競賽?
數據集由 Total-Text、SCUT-CTW 1500和百度非規則文字數據集組成,累計新增7千張任意形狀數據,總計10176張,是目前業界最大的任意形狀場景文字集合。
現有 ICDAR 文字數據集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)只包含水平、四邊形文字框等規則文字標注,如下圖所示,ICDAR2019-ArT 數據集中每張圖像至少含有一個非規則形狀文字(irregular text instances),并采用多邊形多點對任意形狀文字包圍框進行精確標注。
?
▲任意形狀文字示例
?
真實場景文字識別應用中,相比規則文字識別,現有算法非規則形狀文字識別檢測、識別更具挑戰,因此 ICDAR 2019-ArT 競賽旨在進一步推動自然場景下任意形狀文字識別算法與技術突破。
·?數據集
1萬張任意形狀文字圖像標注,中英混合,最大非規則場景文字集合
·?三項競賽任務
文字檢測、文字識別、端到端識別,獎金?$8,700
?
百度愿與 AI 各界同行一起,推動基礎算法、關鍵技術、應用效果新突破。競賽頒獎將在 ICDAR 2019國際會議期間(2019年9月)舉行。還在等什么?快來參與這場盛會,贏取大獎吧!
?
賽事組織單位
百度
馬來亞大學
華南理工大學
西班牙計算機視覺中心
中國圖象圖形學學會
?
賽事時間
2019年2月21日 - 3月31日:注冊通道開放
2019年3月1日:訓練集開放下載
2019年4月9日:提交開始時間
2019年4月30日:提交截止時間
?
聯系信息
ICDAR-2019@baidu.com
?
競賽注冊通道
ICDAR 2019-LSVT 大規模弱標注街景文字識別競賽:
ICDAR 2019-ArT 任意形狀文字識別競賽:?
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 獲取最新論文推薦
總結
以上是生活随笔為你收集整理的ICDAR 2019国际竞赛召开在即,百度联合学界重奖破局者!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KDD 18 AAAI 19 | 异构
- 下一篇: 初级数据分析师需要哪些必备技能?