音视频技术开发周刊 63期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第63期內容,祝您閱讀愉快。
架構
傅德良:選擇視頻編碼器的誤區
本文來自Hulu全球高級研發經理、視頻編解碼與傳輸領域資深專家傅德良在LiveVideoStackCon 2018熱身分享,并由LiveVideoStack整理而成。在分享中,傅德良以 Hulu實踐為基礎,介紹了視頻編解碼標準與視頻編碼器間的紛爭以及視頻編碼器對比中的常見誤區。
林緒虹:看好QoE、音視頻內容理解與AV1
還記得你在大學時候的夢想嗎?職場上打拼多年,你的工作領域與你之前的專業還有多少相關?技術、行業與時代的洪流將一些人推上人生巔峰,又把一些人無情的拍向谷底。LiveVideoStack郵件采訪了YY音視頻算法中心負責人林緒虹,從直播領域的起伏聊到時代,從學習方法聊到技術趨勢。
Cloudflare Nginx優化成果:每天為互聯網節約54年
Nginx是世界范圍內使用最廣泛的負載均衡器和web服務器之一。Cloudflare大規模使用Nginx來支持自身的邊緣節點。在其使用過程中碰見了一些問題,通過優化這些問題,Nginx的性能得到了極大提升。本文是Cloudflare對其所做的一些優化的具體分析和結論,對于工程師和架構師來說,十分值得一讀。
從Go高性能日志庫zap看如何實現高性能Go組件
zap是uber開源的Go高性能日志庫。本文作者深入分析了zap的架構設計和具體實現,揭示了zap高效的原因。并且對如何構建高性能Go語言庫給出自己的建議。
PWA初探
HTML 5 曾被認為是移動應用的明天,卻被原生App在性能和功能上輕易戰勝,Web逐漸成為App的附屬。然而,馬云“爸爸”告訴我們:“夢想還是要有的,萬一實現了呢?”如今,我們離夢想又近了一步。
金山云三招保障百萬級直播
央視網是本屆亞運會移動端直播的重要平臺,將在亞運會期間密集直播各項賽事。金山云作為央視網的合作伙伴,將為客戶提供直播保障,帶給觀眾身臨其境的視聽體驗。
十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代芯片架構
從今年年初開始,英偉達將發布新一代架構的消息就已經傳的沸沸揚揚,傳聞稱架構代號也許會是「Ampere」,也可能是「Turing」。在SIGGRAPH 大會上,英偉達創始人兼首席執行官黃仁勛在其主題演講上發布了這一新架構,除此之外還推出了全新的 RTX 系列 GPU。
音頻/視頻技術
音視頻開發
音視頻開發,就是要掌握圖像、音頻、視頻的基礎知識,并且學會如何對它們進行采集、渲染、處理、傳輸等一系列的開發和應用。
iOS音視頻-01-音頻播放(FFMpeg+AudioUnit)
本文主要介紹如何使用FFmpeg完成一個音視頻播放Demo,用AudioUnit播放一個Mp3, AAC文件。
如何快速實現移動端短視頻功能?
在“互聯網+”概念被炒的如火如荼的今天,短視頻以視頻短、傳播快、生產流程簡單、制作門檻低、參與性強等特點在互聯網所有的熱門的焦點中脫穎而出,出現在公眾的視野里。那么如何快速實現移動端短視頻功能呢?本文作者將根據其對行業的洞察,結合網易云信技術進行具體的分析。
流媒體技術筆記
Darwin Streaming Server簡稱DSS。DSS是Apple公司提供的開源實時流媒體播放服務器程序。整個程序使用C++編寫,在設計上遵循高性能,簡單,模塊化等程序設計原則,務求做到程序高效,可擴充性好。
編解碼
Capped CRF:節省編碼成本和數據流
Capped CRF編碼是一種單通道編碼方法,與雙通道VBR相比,可以節省編碼成本。Capped CRF也是一種簡單的per-title編碼方法,可以降低帶寬成本并且提高觀眾的體驗質量。本文來自資深多媒體技術咨詢師Jan Oze,LiveVideoStack對原文進行了摘譯。
iOS硬編解碼相關知識
蘋果在iOS 8.0系統之前,沒有開放系統的硬件編碼解碼功能,不過Mac OS系統一直有,被稱為Video ToolBox的框架來處理硬件的編碼和解碼,終于在iOS 8.0(即WWDC 2014 513)后,蘋果將該框架引入iOS系統。
FFmpeg編碼支持與定制
FFmpeg本身支持一些音視頻編碼格式、文件封裝格式與流媒體傳輸協議,但是支持的數量仍然有限,FFmpeg所做的只是提供一套基礎的框架,所有的編碼格式、文件封裝格式與流媒體協議均可以做為FFmpeg的一個模塊掛載在FFmpeg框架中。
Netty 編碼解碼應用
Tcp基于字節流的傳輸層通信協議,把數據流分區成適當長度的報文段,報文段長度有限,當傳輸大量數據,需要將大報文拆分成為小報文對傳輸的報文進行粘包和拆包。
MediaCodec AudioRecord 硬編 AAC 格式音頻(一)
AAC是一種音頻壓縮格式,區別于無損的 PCM 數據格式,其中分成了兩種:ADTS 和 ADIF 格式。
Chromium中 WebRTC 視頻解碼過程分析
WebRTC 默認采用的編碼格式為 VP8,所以解碼對應的解碼方法也是 VP8.?
AI智能
深度學習入門---Numpy圖像處理
在Python的學習過程中,我們實際上有各種圖像處理庫可以使用,比如opencv,Matplotlib,Scipy等等,這里我們使用Numpy來實現圖像處理算法,以此來加深Numpy和圖像算法的學習。
App基于手機殼顏色換膚?先嘗試一下用KMeans來提取圖像中的主色
k - 平均算法(中文: k -means clustering)源于信號處理中的一種向量量化方法,現在則更多地作為一種聚類分析方法流行于數據挖掘領域 .k - 平均聚類的目的是:把n個點(可以是樣本的一次觀察或一個實例)劃分到 k個聚類中,使得每個點都屬于離他最近的均值(此即聚類中心)對應的聚類,以之作為聚類的標準。這個問題將歸結為一個把數據空間劃分為Voronoi cells的問題。
清華&商湯開源CVPR2018超高精度人臉對齊算法LAB
人臉的邊緣信息和人臉關鍵點有很明顯的重要關系,而以往的人臉對齊(Face Alignment)算法并沒有很好的利用邊緣信息,本文提出一種基于邊緣感知的人臉關鍵點檢測算法,將人臉邊緣線所描述的結構信息融入到關鍵點檢測中,極大地提升了算法在大側臉、夸張表情、遮擋、模糊等極端情況下的檢測精度。
如何通過深度學習輕松實現自動化監控?
這是一篇關于使用基于深度學習的目標檢測來實現監控系統的快速教程。在教程中通過使用 GPU 多處理器來比較不同目標檢測模型在行人檢測上的性能。
對抗深度學習: 魚 (模型準確性) 與熊掌 (模型魯棒性) 能否兼得?
分類的準確度長期以來都是評價圖像分類模型性能的最核心甚至唯一標準。但最近研究表明,即使是充分訓練好的深度神經網絡模型也很容易被對抗攻擊算法攻破。對抗攻擊是指在圖像上加入特定的且人眼無法察覺的微量噪聲,使得目標模型對加噪之后得到的對抗樣本做出錯誤分類。
比RNN快136倍!上交大提出SRNN,現在RNN也能做并行計算了
上海交通大學最新提出切片循環神經網絡(SRNN),其速度是標準RNN的136倍,并且還能更快!對六個大型情緒分析數據集的實驗表明,SRNN的性能均優于標準RNN。
圖像
Metal入門教程總結
本文介紹Metal和Metal Shader Language,以及Metal和OpenGL ES的差異性,也是實現入門教程的心得總結。
HDR質量評價技術
本文聚焦HDR質量評價技術,對于編解碼、色調映射以及逆色調映射等不同任務,通常會采取不同的評價方法。本部分先從主觀評價和客觀評價兩個角度對常用的HDR視覺質量評價技術做整體介紹。
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的音视频技术开发周刊 63期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 朱政:金山H.265诞生记
- 下一篇: 快手QoE指标设计的分析初探