这是一个对于实时通讯无比依赖的时代,从大家都剁手过的电商直播购物,到因为疫情而火上加火的线上课堂,居家办公或者异地团队交流的视频会议,在让大家都感受到无比便利的背后,都离不开强大的RTC技术作为支撑,RTC已经像高铁这样的基础设施一样,提供了基本的技术栈和能力,具体应用到什么场景,
RTC本身并不应该称为一种技术,而更应该称为一种技术的集合,它包含着非常广的技术范围,也已经远远超越了通讯人口里传统的信令协商、音视频编解码等等,这些已经是RTC技术中基础的基础;在一个追求应用快速上线的时代,在用户侧就需要能够同时应用于移动端(还分安卓和苹果)、Web端的SDK套件;在输入侧,需要设备各种CPU架构以及操作系统的采集设备(像手机、摄像头设备等);在传输侧,要建设好时延满足业务要求的网络(无论是自部署网络机房还是借用运营商网络),如果纯使用互联网方式效果肯定是大打折扣的(这里有篇个人觉得很经典的文章“WebRTC从Demo到商用还有多少路要走”);三段联动,因此毕竟无论用户侧还是输入侧,最后一公里的接入肯定都是运营商的网络(4G/5G or WiFi),出现保证一定丢包率下的视频和声音的通讯质量,这些都已经是RTC通讯平台提供的标配了。
基于RTC都已经提供的这么完整了,那RTE是要走什么呢,个人觉得有几点(从低到高)
1 已经非常成熟的RTC上面基于具体的业务场景,给与客户更高层次的组合搭配,上面说了那么多的通讯术语,并不是所有开发者小伙伴或者管理者都熟悉的,要包装出更能快速上手、更应用简单、满足客户场景诉求的组合套餐;要做好这点并不容易,首先要对各业务场景足够的熟悉,对客户诉求有足够的认知,再者从技术架构上讲,很多模块要拆分的很细致很解耦,才能像搭积木一样给不同用户搭建不同的RTE业务套餐
2 后续针对不同的业务场景,可能延伸出不同的技术创新点,比如像非互动直播RTSP协议就可以满足信令协商诉求,但是像视频会议就需要类似SIP这类协议支持呼出,呼入,多方加入会议以及会控等等比较复杂的业务要求;再比如美颜,这个一般在会议里用不到,但是在直播里基本属于标配;
3 与AI的结合,可能会有基于不同的业务场景搭配不同的AI模型和应用,比如互动与非互动直播,两者对时延差异要求就比较大,互动秒级,非互动10几秒可能也是可以接受的;再比如虚拟背景,除了好玩之外,对个人隐私也起了些许的保护作用;还比如平台都对于不良信息负有管理责任,这类海量信息肯定需要通过AI来识别
总之这是一个几乎每天都在技术和场景革新的时代,上面的介绍只是蜻蜓点水,真正的应用丰富多彩,而随着VR,AR,5G网络、AI大融合,元宇宙在不久的将来可能真的作为我们的另一个身份世界存在,视频和音频是我们在另一个世界的眼睛和耳朵;感叹于如此快速的发展和变化同时,作为通讯人对未来应该有着无比的期待。