11.2 滑动窗口-机器学习笔记-斯坦福吴恩达教授
生活随笔
收集整理的這篇文章主要介紹了
11.2 滑动窗口-机器学习笔记-斯坦福吴恩达教授
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
滑動窗口(Sliding window)
文本檢測中的滑動窗口
滑動窗口是檢測圖像中目標對象的最常用手段,在文本檢測階段,我們首先定義正、負樣本,正樣本圖像描述了含有文本的圖像,負樣本描述了不含文本的圖像:
通過在原圖像沿行、列滑動我們定義好的窗口,并讓窗口內圖像與正負樣本進行比較:
當窗口遍歷過整幅圖像后,獲得原圖像對應的掩膜,高亮度的區域都為疑似文本框的區域:
掩膜中的文本框斷斷續續的,因此還考慮使用形態學膨脹操作來讓文本框更加完整:
字符分割中的滑動窗口
在文本檢測階段,我們的滑動窗口是分別沿著行、列進行掃描的,因此是 2 維的掃描過程。而在字符分割過程中,同樣將使用到滑動窗口技術,只是這次我們將窗口的高度設置為與文本框等高,只進行 1 維的行掃描:
我們同樣需要定義正負樣本,來讓窗口知道哪些是字符,哪些包含了字符的分界:
總結
以上是生活随笔為你收集整理的11.2 滑动窗口-机器学习笔记-斯坦福吴恩达教授的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 11.1 问题描述及流程-机器学习笔记-
- 下一篇: 11.3 人工合成数据-机器学习笔记-斯