音视频技术开发周刊 | 173_飞道的博客

音视频技术开发周刊 | 173

2021-01-23 13:48 797人阅读评论(0)

每周一期，纵览音视频技术领域的干货。

新闻投稿：contribute@livevideostack.com。

阅读推荐

新版SVT-AVS3发布编码效率提升并提供更灵活的编码工具

SVT-AVS3的用户正在从广电领域渗透到互联网企业。

https://mp.weixin.qq.com/s/xO1tefcT5mkoimJvrmTeuA

架构

选择HLS或WebRTC需要考虑的五个因素

当问到直播视频时使用低延迟HLS还是WebRTC，WebRTC显然是赢家。

https://mp.weixin.qq.com/s/UBktJBCoSrd74T2B0X41Ng

WebRTC + NDI: Part II

Janus 加强了对 NDI 的支持，使其可以投入到生产环境使用了。

https://www.meetecho.com/blog/webrtc-ndi-part-2/

WebRTC服务器设计小结

本文我们来侃一侃对服务器设计细节的思考。

https://juejin.cn/post/6901682950673760269

传输网络

亚洲地区的下一代CDN服务演进

本文来自Streaming Media的一篇演讲，作者是Baishan云公司的产品高级总监Angel Chin，内容是亚洲地区的下一代服务演进。

https://mp.weixin.qq.com/s/G4WARzTuHgKLlSYTXgBpoA

『CDN』让你的网站访问起来更加柔顺丝滑

当你在访问淘宝、京东准备剁手的时候，虽然进入页面的时候有很多的图片、很多的内容，但是加载起来却很快，让你剁手的动作如水般丝滑。难道就是靠大厂背后充足的服务器、宽带资源以及过硬的优化技术了吗？当然了，这肯定是必要的条件，除此之外就靠我们今天要说的 CDN 技术了。

https://mp.weixin.qq.com/s/UcH83h88yvSjxIc15W_rmA

CDN工作原理及其在淘宝图片业务中的应用

淘宝的图片访问，有98%的流量都走了CDN缓存，只有2%会回源到源站，节省了大量的服务器资源。

但是，如果在用户访问高峰期，图片内容大批量发生变化，大量用户的访问就会穿透cdn，对源站造成巨大的压力。

今年双11，淘宝鹿班的主图价格表达升级项目，就面临了这种挑战，让我们看看是如何解决的吧。

https://juejin.cn/post/6901479190244098062

资讯速览

长视频战争：十年 1000 亿人民币，烧出了三家电视台

我们采访了这个行业数十位从业者、投资人，几乎没人能总结出这场战争的意义，唯一得到的一个结论是：他们砸了超过 1000 亿人民币。

https://mp.weixin.qq.com/s/zVEgHePsel_46qB1rnTLHA

软银以6.9亿美元入股提供基于云的“全渠道”语音，视频和消息服务公司 Sinch

尽管世界各地的人们已经接受了移动消息传递功能来与亲朋好友互动，但是大多数企业尚未抓住这一机会。

https://techcrunch.com/2020/12/01/softbank-takes-a-690m-stake-in-cloud-based-swedish-crm-company-sinch/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29

编解码

视频基础和MP4容器解封装

最近在研究基于移动端平台上使用视频做动画载体的方案，目前移动端平台使用动画的方案有：gif图、apng、webp、lottie、svga等，各有各的优势，也有相应的劣势，而使用视频做动画的目的，寻求的是完美还原设计师的设计特效外，同时性能达到极致。在这个过程中，也积累了一些视频相关的知识，借此同大家分享下。

https://mp.weixin.qq.com/s/-n9-J-ld-YrT4hnaaKGHcQ

云端无压缩视频&广播的未来

本文记述了SMPTE的一次关于云端无压缩视频&广播的未来的Webinar，由IABM的CTO与几位亚马逊公司广播方面的专家参与。本次研讨会主要围绕着云端无压缩视频以及广播媒体未来的几个重要问题进行了探讨。

https://mp.weixin.qq.com/s/ika-gvIJW5HjlMd5CzaYxg

音视频技术

One Shot 3D Photography

3D摄影是一种新的媒体，它使观众可以更充分地体验捕捉的瞬间。

https://facebookresearch.github.io/one_shot_3d_photography/

使用带有字节范围寻址的LL-HLS来实现低延迟流中的互操作性

本文将研究使用基于范围的寻址可以解决的问题，使其有效运行所要满足的要求以及通过大规模部署它可以获得的好处。

https://mp.weixin.qq.com/s/4gsfHGcPYO3al3ZuPoUaoQ

ATSC3.0：下一代电视广播标准

本次讨论来自THE VIDEO INSIDERS，参与讨论的有来自IBM媒体与娱乐的首席技术官Peter Guglielmino。本次讨论主要涵盖了NextGen TV(ATSC3.0)背后的用例、商业模式和技术部署。

https://mp.weixin.qq.com/s/PFqDK620My5gSEV8MVONLQ

AI智能

告别渣画质，视频会议带宽降90%，英伟达公开Maxine服务背后重要技术

10 月初，英伟达推出了一项 AI 视频会议服务 Maxine，使用了 AI 来提升分辨率、降低背景噪声、压缩视频、对齐人脸以及执行实时翻译和转录。最近，英伟达团队发布的新论文揭露了这背后的技术。

https://mp.weixin.qq.com/s/C9jQN_fvJ_9To3Ua8xz3Tw

研究人员的AI技术能够实时匹配活页乐谱与MIDI音频

音乐AI技术正在快速发展。

https://mp.weixin.qq.com/s/ACR2HCnwrdxY2eS9wG4jww

AlexNet：深度卷积神经网络开始兴起

虽然Yann LeCun在上个世纪就提出了卷积神经网络LeNet，并使用LeNet进行图像分类，但卷积神经网络并没有就此飞速发展。在LeNet提出后的将近20年里，神经网络一度被其他机器学习方法超越，如支持向量机。

https://mp.weixin.qq.com/s/zuktls_ktybxaAK8GlEMfw

图像

图片压缩库 compressor 学习

compressor 是一个 Android 平台上的开源图片压缩库，使用它，可以方便的对本地图片进行压缩，并提供了各种压缩参数设置。

https://juejin.cn/post/6901804309671837709

资源推荐

小型深度学习框架：tinygrad

tinygrad 是美国知名黑客 George Hotz 开源的小型深度学习框架 tinygrad，代码不足 1k 行，兼具 PyTorch 和 micrograd 的功能。

https://github.com/geohot/tinygrad

轻量级目标检测：NanoDet

NanoDet 一个超快轻量级无锚对象检测模型，支持实时移动设备。特性：

⚡ 超级轻量级：模型文件只有 1.8 mb。

⚡ 超快：在 ARM CPU 上 97 fps (10.23 ms) 。

???? 训练友好：GPU 内存成本远低于其他模型。在 GTX1060 6G 上可用 Batch-size 80 运行。

???? 易部署：基于 ncnn 推理框架提供 C++ 实现和 Android 演示。

https://github.com/RangiLyu/nanodet

活动推荐

12月11-13日，20位海外技术专家+2场高端圆桌对话，不一样的技术视角，新一代标准与协议，全新的落地实践。

中英文字幕+实时互动机会，更有AOM彩蛋等你发现！

点击【阅读原文】了解详情

转载：https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/110789784

查看评论

飞道的博客

飞道的博客

个人资料

文章分类

文章存档

阅读排行

评论排行

推荐文章

音视频技术开发周刊 | 173

* 以上用户言论只代表其个人观点，不代表本网站的观点或立场