Skip to main content
版本:4.0 (Archived) 📦

WebRTC

WebRTC是通信的能力,从技术上看是两个或多个客户端,让用户具备互动的能力。 人对于延迟的感知是400ms,也就是一般的对话能顺利进行,这是RTC的核心指标。 由于端和端之间有关联,导致系统复杂度比直播高了多个数量级,这是很多问题的根源。

SRS是在2020年支持的WebRTC协议,研发的详细过程请参考#307。 直播和RTC的协议或能力,是SRS的核心能力,新的音视频开发者,将不会区分直播和RTC,因为都是互联网视频能力。

SRS对直播和RTC这两种能力的抽象,是流(Stream),一个流会有多个消费者(Consumer),流之间没有关联。 基于流,我们构造了各种业务的能力,比如集群、录制、转码、转发。 基于这些业务能力,我们提供了各种场景下的DEMO,比如低延迟直播、一对一通话、多人通话、连麦等等。

开源最强大的是开放,因为开放所以和每个开发者有关系。 开源最大的问题是没有SLA,只能提供DEMO不能提供服务,也不能及时给予开发者支持。 和开源结合的云服务,弥补了开源的短板,SRS的开源方案,会和云服务对接,利用云服务的能力补充开源没有SLA的短板。

对于RTC,SRS提供两个关键的能力:

  • 开源的全链路能力、方案和DEMO,能快速搭建和了解RTC系统。
  • 无缝(尽量)对接云服务,平滑(尽量)迁移到云,保障业务的发展。

Config

RTC的配置很多,详细配置参考full.conf,如下:

rtc_server {
    enabled on;
    listen 8000;
    candidate $CANDIDATE;
}

vhost rtc.vhost.srs.com {
    rtc {
        enabled on;
        rtmp_to_rtc off;
        rtc_to_rtmp off;
        nack on;
        twcc on;
    }
}

第一部分,rtc_server是全局的RTC服务器的配置,部分关键配置包括:

  • enabled:是否开启RTC服务器,默认是off。
  • listen:侦听的RTC端口,注意是UDP协议。
  • candidate:服务器提供服务的IP地址,由于RTC的特殊性,必须配置这个地址。
  • ecdsa:服务器自动生成的证书种类,ECDSA或RSA,是否用ECDSA。

第二部分,每个vhost中的RTC配置,部分关键配置包括:

  • rtc.enabled:是否开启RTC能力,默认是off。
  • rtc.rtmp_to_rtc:是否开启RTMP转RTC。
  • rtc.stun_timeout:会话超时时间,单位秒。
  • rtc.nack:是否开启NACK的支持,即丢包重传,默认on。
  • rtc.twcc:是否开启TWCC的支持,即拥塞控制的反馈机制,默认on。
  • rtc.dtls_role:DTLS角色,active就是DTLS Client(主动发起),passive是DTLS Server(被动接受)。

There are some config for WebRTC:

  • full.conf: Section rtc_server and vhost rtc.vhost.srs.com is about WebRTC.
  • rtc.conf: WebRTC to WebRTC clients.
  • rtmp2rtc.conf: Covert RTMP to WebRTC.
  • rtc2rtmp.conf: Covert WebRTC to RTMP.

Config: Candidate

由于candidate特别、特别、特别的重要,大概有1/3的朋友的问题都是这个配置不对。只要candidate配置不对,一定会出问题,没有其他可能,是一定会出问题。

其实,candidate就是服务器的候选地址,客户端可以连接的地址ip:port,在SDP交换中,就有个candidate的信息,比如服务器回的answer可能是这样:

type: answer, sdp: v=0
a=candidate:0 1 udp 2130706431 192.168.3.6 8000 typ host generation 0

上面SDP中的192.168.3.6 8000,就是candidate listen这两个配置,即服务器的IP和端口。 既然是服务器的IP,那么目前有几种方式可以配置:

  • 直接配置成固定的IP,比如:candidate 192.168.3.6;
  • 用命令ifconfig获取本机的内网IP,通过环境变量传递给SRS,比如:candidate $CANDIDATE;
  • 自动获取,先读取环境变量,然后获取本机网卡的IP,比如:candidate *;,下面会有详细说明。
  • 在url中通过?eip=x指定,比如:webrtc://192.168.3.6/live/livestream?eip=192.168.3.6
  • 若API和SRS是同一个服务器(默认就是),可以用API的hostname作为CANDIDATE,这种情况下面单独说明。

此外,自动获取本机网卡IP的情况,相关配置如下:

  • candidate *;candidate 0.0.0.0;,支持任意IP,就意味着让服务器自己选择,先选公网IP,然后选内网IP。
  • use_auto_detect_network_ip on; 若关闭这个功能,则不会自动选择IP。
  • ip_family ipv4; 自动选择IP时,选择IPv4还是IPv6的地址。

由于WebRTC推拉流之前,必须访问HTTP API交换SDP,因此在HTTP请求中的hostname一般就是SRS的公网域名或IP。相关配置如下:

  • api_as_candidates on; 是否开启这个功能。若API是单独的服务器,可以关闭这个功能。
  • resolve_api_domain on; 若API是域名,是否将域名解析为IP地址。注意Firefox不支持域名,所以一般是推荐打开的。
  • keep_api_domain on; 是否保留API的域名,支持域名解析的客户端可以自己解析IP地址,避免服务器实现解析。

Note: 注意,如果以上途径无法获取CANDIDATE,还是会自动选择一个网卡的IP,避免失败(无CANDIDATE一定失败)。

简单来说,如果在SRS运行的服务器上,运行ifconfig获取的IP地址,是客户端访问不了的地址, 就必须通过配置candidate,指定一个客户端能访问的地址。

通过ifconfig获取本机IP:

# For macOS
CANDIDATE=$(ifconfig en0 inet| grep 'inet '|awk '{print $2}')

# For CentOS
CANDIDATE=$(ifconfig eth0|grep 'inet '|awk '{print $2}')

# Directly set ip.
CANDIDATE="192.168.3.10"

设置环境变量,然后启动SRS:

env CANDIDATE="192.168.3.10" \
  ./objs/srs -c conf/rtc.conf

用Docker方式运行SRS,设置环境变量的方法:

export CANDIDATE="192.168.3.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtc.conf

Note:Docker的详细用法参考srs-docker, 镜像地址和可用的版本参考这里这里

Stream URL

直播和WebRTC的基本概念都是流(Stream),流的URL定义有很高的概念一致性, 参考下面SRS的几个演示流:

在线演示,WebRTC推流,WebRTC播放:

Remark: 可能会比较卡,因为服务器支持3个并发观看。

Remark: 由于Flash已经被禁用,RTMP流无法在Chrome播放,请使用VLC播放。

本机启动SRS(参考usage),开启直播和RTC,对应的流地址是:

SRS的URL定义,遵守的是HTTP的URL定义,不同的流的schema不同,比如RTC的是webrtc

HTTP API

关于SRS的WebRTC API,请参考publishplay.

RTMP to RTC

WebRTC可以作为直播的一个播放器,播放直播流,延迟比RTMP还要低,更能抗网络抖动。

本机启动SRS(参考usage),例如:

export CANDIDATE="192.168.1.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtmp2rtc.conf

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

Remark: SRS 4.0.14+支持RTMP推流,WebRTC播放。

相关的配置说明:

  • rtc.rtmp_to_rtc:是否将RTMP转RTC。禁用时,推RTMP流无法使用WebRTC播放。开启时,音频转码为opus(一路流消耗2%左右CPU)。
  • rtc.keep_bframe:是否保留B帧,RTMP流中一般会有B帧,而RTC没有,默认丢弃B帧。
  • min_latency:如果开启了RTC,这个配置的默认值也是on,而RTMP这个的默认值是off。
  • play.mw_latency:如果开启了RTC,这个配置的默认值是0。
  • play.mw_msgs:如果开启RTC,min_latency开启默认为0,否则默认为1,比直播的默认值要小。

使用RTMP推流到本机:

docker run --rm -it registry.cn-hangzhou.aliyuncs.com/ossrs/srs:encoder ffmpeg -stream_loop -1 -re -i doc/source.flv \
  -c copy -f flv rtmp://host.docker.internal/live/livestream

可播放的流地址:

Remark: 默认静音(H5自动播放要求的),可以点右下角小喇叭开启声音。

RTC to RTC

WebRTC本身是可以推流和拉流的,全链路延迟都很低。

本机启动SRS(参考usage),例如:

export CANDIDATE="192.168.1.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtc.conf

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

Remark: SRS 4.0.76+支持WebRTC推流,WebRTC播放。

演示,WebRTC推流和播放,链接:

Remark: 推流时,必须是HTTPS页面,当然本机localhost没这个限制。

RTC to RTMP

WebRTC推流,可以转成RTMP流播放,SRS只会对音频转码(Opus转AAC),因此要求视频是H.264编码。

本机启动SRS(参考usage),例如:

export CANDIDATE="192.168.1.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtc2rtmp.conf

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

Remark: SRS 4.0.95+支持WebRTC推流,RTMP/HTTP-FLV播放,参考#2303

相关的配置说明:

  • rtc.rtc_to_rtmp:是否开启RTC转RTMP,只会对音频转码(Opus转AAC),视频(H.264)不转码,默认off。
  • rtc.pli_for_rtmp:请求关键帧的间隔,单位秒,RTC没有固定GOP,而RTMP一般需要,默认6.0。

演示,WebRTC推流和播放,链接:

SFU: One to One

SRS早就具备了SFU的能力,比如一对一通话、多人通话直播连麦等等。在沟通中,一对一是常用而且典型的场景, 让我们一起来看看如何用SRS做直播和RTC一体化的一对一通话。

下面以Docker中运行DEMO为例子,若希望从代码编译,请设置好对应的环境变量和启动命令。

本机启动SRS(参考usage),例如:

export CANDIDATE="192.168.1.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtc.conf

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

Note: More images and version is here.

Note: Demo的H5页面,是在SRS镜像中的。

本机启动信令(参考usage),例如:

docker run --rm -p 1989:1989 registry.cn-hangzhou.aliyuncs.com/ossrs/signaling:1

Note: More images and version is here.

启动httpx-static,转换HTTPS和WSS协议:

export CANDIDATE="192.168.1.10"
docker run --rm -p 80:80 -p 443:443 registry.cn-hangzhou.aliyuncs.com/ossrs/httpx:1 \
    ./bin/httpx-static -http 80 -https 443 -ssk ./etc/server.key -ssc ./etc/server.crt \
          -proxy http://$CANDIDATE:1989/sig -proxy http://$CANDIDATE:1985/rtc \
          -proxy http://$CANDIDATE:8080/

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

本机(localhost)可以直接打开http://localhost/demos/one2one.html?autostart=true

若非本机,则可以打开https://192.168.3.6/demos/one2one.html?autostart=true

注意:自签名证书,在空白处输入thisisunsafe(注意没空格)。

SFU: Video Room

SRS支持多人通话的SFU能力,请参考一对一通话搭建环境,然后访问页面:

本机(localhost)可以直接打开http://localhost/demos/room.html?autostart=true

若非本机,则可以打开https://192.168.3.6/demos/room.html?autostart=true

注意:自签名证书,在空白处输入thisisunsafe(注意没空格)。

若需要会议转直播,请参考RTC转直播

Room to Live

上面我们介绍了一对一通话,如果能将这个通话合成一个流,叠加视频和混音, 转成RTMP流推送到直播,这就是连麦了。

Note: 多人通话也是可以转直播的,原理一样,只是多人通话的流更多。

注意请开启RTC转RTMP,我们合并的是RTMP流,例如:

export CANDIDATE="192.168.1.10"
docker run --rm --env CANDIDATE=$CANDIDATE \
  -p 1935:1935 -p 8080:8080 -p 1985:1985 -p 8000:8000/udp \
  registry.cn-hangzhou.aliyuncs.com/ossrs/srs:4 \
  objs/srs -c conf/rtc2rtmp.conf

Note: 请将CANDIDATE设置为服务器的外网地址,详细请阅读WebRTC: CANDIDATE

Note: More images and version is here.

Note: 请参考一对一通话启动Signaling和httpx-static。

视频合流非常非常消耗CPU,而且有很多种方式:

  • SRS+FFmpeg,SRS将WebRTC流转RTMP,FFmpeg将多路RTMP合流。优势:延迟小,音质好;缺点是命令行难度高。
  • SRS+OBS,方案和SRS+FFmpeg一样,不过用OBS来实现合流。优势:图形化界面更友好,音质好;缺点是延迟大有不同步风险较大。
  • OBS抓浏览器,OBS直接捕获浏览器窗口和电脑的音频。优势:可见即所得,依赖少;缺点是音质不如前面的方案。

SRS+FFmpeg方案,我们在一对一通话的DEMO中,给出了使用FFmpeg合流的命令,比如:

ffmpeg -f flv -i rtmp://192.168.3.6/live/alice -f flv -i rtmp://192.168.3.6/live/314d0336 \
     -filter_complex "[1:v]scale=w=96:h=72[ckout];[0:v][ckout]overlay=x=W-w-10:y=H-h-10[out]" -map "[out]" \
     -c:v libx264 -profile:v high -preset medium \
     -filter_complex amix -c:a aac \
     -f flv rtmp://192.168.3.6/live/merge

输入:

  • rtmp://192.168.3.6/live/alice
  • rtmp://192.168.3.6/live/314d0336

输出:

  • rtmp://192.168.3.6/live/merge

SRS+OBS可以添加多个MediaSource(媒体源),将File(文件)的勾选去掉,就可以输入上面的两个RTMP流。

OBS直接捕获浏览器,可以选择WindowCapature(窗口捕获),直接选择浏览器即可。

Note: 转直播后,就可以使用SRS的直播录制(DVR)功能,将每个RTC流录下来,也可以录合并的流。

Winlin 2020.03