网宿科技云视频产品总监:视频技术如何驱动互联网教育企业发展
吕士表,毕业于厦门大学,2007年加入网宿,是网宿首位Cache产品经理,创建了网宿match流媒体直播产品,网宿移动加速产品,网宿流量经营系列产品。吕总熟悉流媒体产品、技术架构及运维优化,目前负责网宿流媒体新技术、新产品及新应用场景,及产业合作。以下是其在保利威视视频极客系列沙龙上的演讲内容整理。
大家下午好,我是来自网宿CDN的吕士表,负责网宿流媒体产品。在过去的10多年,我和网宿的小伙伴们一起为很多互联网教育企业提供加速服务。网宿提供的服务类似顺丰快递,只是网宿做的是电子信息的快递,保证了在线教育内容可快速、稳定及经济地传输到学员和用户电脑和手机上。10多年来,我们见证了这个领域的快速发展,也感受到视频技术在互联网教育领域的变迁。因此,今天也在此跟大家分享下互联网教育视频技术应用的一些个人思考。今天分享的内容主要是以下四部分:互联网教育发展概述、视频技术发展历程、教育视频建设方案、网宿视频平台简介。
一、互联网教育发展概述
1、互联网教育的发展历程
(1)1994-1996萌芽期
网络基础条件差,但国家教委大力支持,远程教育概念提出;以文本形式为主,教学体验相对较差。
(2)1996-2000 短暂繁荣期
国家支持的高等学历在线教育得到发展,弘成等民营培训机构也积极转战线上,与40多家高校展开合作。
网校概念被炒得火热,数量达到近8000家。
互联网技术提升,多媒体参与教学,但制作成本较高,规模化程度很难。
(3)2000-2010 徘徊期
信息化程度加深,发展徘徊前进。
2000年互联网泡沫在线教育企业时候到重创。
非典大规模停课潮,网校开始小范围复苏。
高等学历教育成为在线教育增长的主要动力,上市热潮初现。
网校内容难以吸引用户,盈利成疑。
(4)2010-2014年 快速发展期
在线教育投资热潮出现,创业热潮火热展开。
教育形式、渠道、多元化。
市场规模、企业数量、用户规模稳定快速增长。
职业、语言在线教育细分市场优势突出。
BAT等老牌互联企业、传统教育机构、初创企业各方参与混战,企业存活率低。
(5)2014年之后 行业整合期
伴随投资和发展热潮而来的是企业的并购融合。
并购热潮初现并有逐步扩大的趋势,行业洗牌期到来,短期内初现在线教育的小低谷。
真正的颠覆教育还为时尚早。
战场逐步向移动端转移。
(6)2018年之后 高速发展期
行业整合,加速教育产业升级。
在线教育行业复苏,行业巨头初见规模。
大额投融资进入,帮助企业进行新的研发和扩张,上市热潮兴起。
最近的两三年,视频行业发生了很大的变化,2015年可以说是VR的元年,2016年就是直播的元年,今年应该是短视频这块,发展得特别特别地快,这些在教育方面也会有一些非常直接具体的影响。
2、视频技术发展对教育的影响
从视频本身技术的角度来看,视频的起源实际上是非常非常早的。
1888 年,法国人雷诺试制了 “光学影戏机”,用此机拍摄了世界上第一部动画片《一杯可口的啤酒》;
1906到1929年,整个电影开始发展,随后电视就出来了,但是这些基本上视频的技术都还是在模拟信号上面,这些的兴起使整个视频进入一个数字化的时代;
2003 年以后,H.264 压缩技术正式出现,视频被进一步压缩,可以以低码率高质量的形式在网络上进行传播。一个原始的视频假设是10G,但最终通过H264压缩了之后,它就会变成100M这样子,整个压缩比是非常非常高的。
07年之后,互联网发展会非常快,包括优酷土豆这些也起来了,教育方面整个视频应用也就变得非常非常地多,特别地多元化。现在就变需要我们去支持安卓手机、iPhone手机、iPAD等各种终端。这两年Flash慢慢开始消除,所以,接下H5会大行其道。
二、视频技术的发展历程
整个视频技术方面的发展真的变化非常非常的大,具体来讲,可能会涉及到从视频的采集,视频的制作,制作包含整个内容本身的制作,你要制作什么样的内容,你要加字幕等等这些,还包含编转码等等;编完之后,传到服务器上,跟网站结合,然后分发给最终用户了;最终你还要做一个播放器,让用户可以观看,从以前Windows的Midplayer到现在的整个各种APP上面的这些播放,H5上的这种播放,最终用户也比之前扩大了几十倍,现在中国互联网上整个移动用户有7-8个亿这样的一个规模,比之前会多很多。
在技术上,随着云计算的快速发展,包括CDN的快速发展,让整个视频的制作,包括传输,包括播放就变得特别特别地简单。以前需要扛着一个很大很大的摄像机,才能去录制视频,现在用手机就可以,而且手机还能做互动,可以连麦和主播进行互动。在教育行业里就有一些新的场景:一对一的在线小课,一对多的在线小课,或者说做百人、万人的大课,这个大课其中有几个人还可以连麦进去,跟老师进行互动,下面所有人都可以看得到,整个发生了非常大的变化。
在过去的20年里面,应该说整个视频技术的生态链里面都发生了很大的变化,具体视频的应用还是没有太大太明显的改变,基本上还是在点播、直播、实时的互动(视频聊天)、新兴的AR、VR这块的东西。
1、点播应用变迁
点播的变化,主要的点在于刚才所讲视频涉及到的几个环节,发生了巨大的一个变化。
方式:从WEB到WEB加APP这样的方式转变。
分辨率:之前的整个分辨率实际上是非常低的320P,现在基本上是1080P,如果是VR的这种沉浸式的体验,基本上要到2000P才比较不会有这种颗粒感。
便利性:因整个宽带的发展,外网的介入,特别是4G的普及,整个教育的场景,从原来需要非常直接地坐在一个办公室或者在家里面固定的位置到可以移动,把非常碎片化的时间利用起来。
内容丰富:内容从整个应试或者兴趣方面扩展到全领域,整个变化是非常的多。
2、直播应用变迁
在直播方面,整个变化会更多一些,特别是直播相对来说是会更加的新兴,这里面我把直播相关的环节做了一个分解:源(视频的录制),管(中间的处理、存储、分发),端(播放)。
源:
在录制方面,已经从专业的设备到普通的机器再到普通的手机。普通的手机现在的计算能力,我们在99年上大学时候,那个时候的电脑,中等配置的电脑还赶不上现在一台iPhone的计算能力,整个变化是非常大的;
延迟方面,从10秒钟到1秒钟的延迟变化;
交互方面,由传统主播到连麦互动。
管:
自建 – CDN分发
网络:2M — 光纤/4G
协议:单协议 – 多协议
传输:私有协议、跨网跨国
端:
播放: web — app — H5
技术:秒开、多码率、延迟追赶、弱网优化
体验:回放、时移
3、互动视讯
互动视讯是这两年来比较新兴的应用方式,可以做到一对一,在技术上的挑战还蛮多的。因为人在通过视频聊天的时候,如果要感觉到没有延时,基本上要在300毫秒或者以下才不会觉得两个人聊天是有所延时的。所以需要协议、编码和播放实现端到端的优化,需要专门的协议,而且需要在两个点之间实现一个最佳的路由。同时,还比传统的加多一个降噪、回音消除,因为两个麦进来之后,同时在播放,又在讲话,两个声音可能会叠加在一起,这个时候就需要做回声消除,而且也要适合多终端。
4、VR\AR技术
这两三年VR也开始进入教育的行业,其中一个最沉浸式的体验,我们看到最大的一个变化是:VR在这两三年里面硬件、软件,整个制作的环境都有比较长足的发展。真正的爆发,我个人觉得可能还需要两年或者三年这样的一个时间,但在基础设施方面,我觉得已经做得差不多了:
1)终端变化
发展到VR/AR技术之后,采集终端发生一定的变化,从最初的摄像机到手机到全景一体机设备,使用场所也从固定的教室到移动平台变得更加多元。
2)编码变化
由于VR视频码率高的特性,更加高效的编码方式变得必不可少,从常用的H264编码变为H265,在保证同样画质的条件下,编码效率提升50%。
据我们统计,2015年之后,不管是安卓还是iPhone,都已经支持H265本身的一个硬件,6月6号的WWDC大会上面也讲到说IOS11接下来也会开始支持H265的硬件,所以整个生态环境来看已经基本具备这种比较好的能力。
3)传输变化
VR全景高码率视频在网络传输中存在一定技术壁垒,如何延迟更低质量更好的传输视频是共同的课题,按需传输应运而生。
4)播放变化
VR全景视频的强交互性要求播放设备有别于传统播放器,需要体感更强的VR设备支持,交互性更强,沉浸感更强、
5、具体案例
(1)Coursera
Coursera是免费大型公开在线课程项目,由美国斯坦福大学两名计算机科学教授创办。旨在同世界顶尖大学合作,在线提供免费的网络公开课程。
2012年创办,已经融了1亿多的美金,有2400万多的注册用户,课程也有2000多,它后面主要的驱动还是音视频的一些技术,当然它还有很多业务上的管理。
(2)公开课/AR
国内也有像网易公开课等的整个用这种视频的CDN服务、SAAS服务等等这些。
下面说的是VR的一些应用场景,通过手机扫一个卡片,就可以把这个虚拟的增强现实投射到桌面上,跟小孩互动。这些内容也可以放到网上一起来做,整个来讲技术上已经相对是比较成熟的。
三、教育视频建设方案
假设大家希望自己建立这样一个网站,会涉及到这样的一个视频服务方案,里面会涉及到哪些环节呢?我这边做了一个简单的分解:
1、自己新建
如果是完全自己来做,你需要在采集、制作方面,包含内容本身的制作、裁剪、编排、加字幕、加音效,同时加编码,之后你还要把内容存起来,存之后还需要传输到最终用户的手上。然后需要给安卓、iOS或者Flash,各种网站上的各种渠道,不同的用户都可以支撑到,这样你就需要一个非常庞大的技术团队,而且要非常非常地专业。
举个例子来讲,国内主流的这种运营商就有5、6个,要保证比较好的用户体验,基本上每个主流的运营商,每个省份,可能都需要有一个节点,那就是6×30,要100多个节点,才能够比较好地服务客户。
2、项目外包
项目外包的方式,就是把项目分解、外包出去,自己管理其中的一部分。这是过去几年我们看到比较多的一种方式,实际上是自己把网站、视频制作、播放器制作这块做完了,然后采购IDC或者CDN这样的方式。
3、部分集成
在12、13年的时候,我会直接负责一些产品的运营,经常会接到客户的电话,就说他们昨天搞了一场活动,卡住了,所有用户看都特别卡。CDN的方式可以解决这个问题,但是CDN实际上有一个问题难去解决,就是你要投入很多应用性的开发,比如说要支持多种播放器,支持各种内容的终端适配等等。相对来说,这种小规模特别是这种方式,这个时间段不太适合去做这个事情。
4、云平台
像保利威视这边提供的服务,比较像SaaS的方式,提供给我们的教育服务商或者内容商,一个端到端的方案。从内容制作、存储、分发到后面的播放,甚至还有安全方面的一些控制。整个来讲,目前最合适的方式,特别是在Star的阶段或者中小型的阶段,最合适的方式还是采用SaaS这样的方式。因为这里面采用SaaS的方式,会带来几个好处:
第一,99.9%可用生,98%的流畅率
不需要去解决刚才提到的180个点的一个问题,可以让广州的用户就在广州当地去访问它的服务器,而且电信、联通、移动可以分别是不同的服务器,即使这些服务器挂了,你也不用去管。后端的CDN能够让用户的体验,可用性、可以访问的至少可以达到三个角,流畅率基本上可以做到98%。也就是按每5分钟一个段,你会发现这5分钟出现卡那就是卡顿,他的流畅率会在98%这样的。
第二,100万级别并发在线,且按需要付费
不需要太多运维、后端的研发人员,整个成本我们测算大概会减少70%。有很多行业主流的方案往往也可以在SaaS里面得到支持了,可能只需要做一些简单的选择或者提一些需求,做一些定制开发可能就可以了。
假设你提高的码率是1兆,然后最高峰是1万个人同时在线,那需要10个G的带宽,那一年假设就在暑假或者什么时候就用一次,其他时候得备着,因为运营商很难让你这两天来用。所以我们通过SaaS这种方式去做这种年化的服务,也就是按需使用,本身是一个很大的池子,像水库一样,水进来随时可以取用。
第三,快速接入,短至1天
如果自己去注册一个帐号,然后去尝试整个这个内容的生成,然后传输、播放、甚至编辑,对它进行归类,分到不同的专辑或者类别里面等等,然后再跟自己的业务系统实际对接,我了解到最快的一个场景,基本上在一天之内就搞定这个事情。
第四,稳定安全
同时整个平台方面,还是可以带来安全性很多的考量,像防盗链、播放是不是被授权,是不是被别人引用,你可以通过UA、IP、cookie等等这些方式去设置;对内容可以做到端对端的加密,甚至可以做到分片的方式去加密;很多时候内容有可能会被录屏,可以做一些水印等等的东西,也可以做一些跑马灯,保证内容是有一定安全的,至少出现知识产权问题的时候,你至少可以做一些追诉。
四、网宿视频平台
SaaS的后面实际上会有CDN的一个支撑,包含刚才讲的这些传输方面的一些优化等等这些,那这个就是网宿在做的一些事情,我们提供一个PaaS的平台,SaaS这块就可以通过API的方式,接入CDN的平台,接入网宿的平台,SaaS这边的每一个用户的配置都可以通过这个API接入到网宿的平台上去,可以实时地生效,不需要通过SaaS这边汇总需求,由网宿后台手工去配置,我们现在已经实现全部的API化的方式。
除了这个对接全部是自动化之外,整个网宿的平台还有1000个节点,包括海外的300余个节点,这些节点我们都可以通过智能调度,把用户调整到离它最近的服务器上去访问,所谓的最近实际上并不一定是物理的最近,网宿在平台上会实时地去探测每个节点的网络情况,可以算出一个群值,然后来计算说你到这个点的访问、下载速度会是最快的,你的访问体验就会最好。这里面还涉及到首次你一打开是不是可以秒开、快速地开,接下去你播放的时候会不会退出,会不会卡,等等这些。
我们过去10几年一直在做分发的运营,这些都是来保证我们能够做到行业最好的一个稳定性。我们现在在国内的资源情况,基本上有45个机房,自己运营的机房会超过200个,还租用了,整个节点超过1000个,国内的6大ISP跟其它的这种小运营商都有很好的覆盖。
这个是我们过去10几年的一个积累,这两三年我们对海外的整个支撑也是非常地快速,我们现在在国外40个国家合作了有60家的合作运营商,包括像猎豹等等的,也是在使用网宿这方面的一个服务。网宿一直是在做互联网加速的服务,对用户的体验去做相应的努力,希望后续也能够加速您的教育视频,加速您的事业,加速您的成功,谢谢!