点击这里给我发消息
咨询

什么是IM系统?

2021-03-05

1、本文内容概述


本文将带你快速了解一个主流IM系统的应用场景、典型架构、技术特点和功能组成,帮你快速建立对IM系统的主观认知。

如果你不想从技术的角度理解IM原理,可以尝试阅读此文:《知识科普:IM聊天应用是如何将消息发送给对方的?(非技术篇)》。

本文已收入即时通讯网的入门纲领性文章《新手入门一篇就够:从零开发移动端IM
》。


2、IM的应用场景


IM其实并不局限于聊天、社交这类“典型”应用中,实际上它已经广泛运用于我们身边形形色色的软件中。

聊天、直播、在线客服、物联网等所有需要实时互动、高实时性的场景等等,都需要应用到 IM 技术。

下面这些场景是我们大家都熟悉的,都用到了IM技术:

  • 1)微信、qq、钉钉等主流IM应用:这是IM技术的典型应用场景;

  • 2)微博、知乎等社区应用:它们利用IM技术实现了用户私信等点对点聊天;

  • 3)抖音、快手等直播/短视频应用:它们利用IM技术实现了与主播的实时互动;

  • 4)米家等智能家居物联网应用:利用IM技术实现实时控制、远程监控等;

  • 5)滴滴、Uber等共享家通类应用:利用IM技术实现位置共享;

  • 6)在线教育类应用:利用IM技术实现在线白板。


3、IM的典型架构



一个典型的IM架构类似于下图这样:


本图引用自《即时消息技术剖析与实战》学习笔记1——IM系统的架构》一文

如上图所示,IM架构中的各分层职责如下:

  • 1)客户端:作为与服务端进行消息收发通信的终端;

  • 2)接入层:也叫网关层,为客户端收发消息提供入口;

  • 3)逻辑层:负责IM系统各功能的核心逻辑实现;

  • 4)存储层:负责IM系统相关数据的持久化存储,包括消息内容、账号信息、社交关系链等;

  • 5)第三方服务:保证APP在未打开或后台运行时也能收到消息通知(这主要是第第3方消息推送服务)。


尤其对于“接入层”,它的职责最为关键,具体是:

  • 1)保持海量用户连接;

  • 2)解析协议,对传输内容进行编解码;

  • 3)维护客户端的连接(也叫“Session”);

  • 4)推送消息。

4、IM技术的特点


IM技术的特点主要就是以下4点:


▶ 1)实时性:

对于IM系统,“实时”二字是精髓,也是这项技术存在关键意义所在。它保证的是消息的实时触达。

举个例子:如果跟你的好友微信或qq聊天,我发的消息他不能即时收到,或者他发的信息你也不知道什么时候能收到,这基本上也就没法聊下去了(干吗不痛快打个电话呢)。

▶ 2)可靠性:

保证消息的不丢失和不重复,是IM系统的另一个关键技术特点。试想,当你在用qq或微信跟女朋友聊天,好不容易鼓起勇气向“她”表白,结果这消息要是丢包了,那肯定得卸载应用了,搞不好砸手机都有可能。当然,好话不说二遍,消息重复也同样恼人。

▶ 3)一致性:

对于单聊消息而言,保证同一个设备的时间顺序、不同设备的漫游同步,也是相当重要的一环。

IM系统中的消息交互,就到底就是人跟人在“说话”,前言不搭理后言、或者胡言乱语式的消息展现,那不是人疯了就是程序疯了,总之就是没法再聊下去了。

▶ 4)安全性:

保证数据传输安全、数据存储安全、消息内容安全,也是IM系统必不可少的特性。尤其在私聊场景下,如果不能做到安全性,聊天的体验跟被人偷窥的感觉是没有区别的。

5、IM的功能组成


浅显的角度讲,一个典型的IM功能组成,无非就是以下5样:

  • 1)联系人列表;

  • 2)聊天界面;

  • 3)消息发送通道;

  • 4)消息接收通道;

  • 5)消息存储;

  • 6)消息未读数。


我们一样一样来说说各自的用途。

▶ 1)联系人列表:


这个很好理解,使用IM系统的第一步,就是要解决“跟谁聊”的问题。从功能表象上来说,联系人列表也就是社交关系列表,无非就是个信息列表界面,有什么特殊的地方?

联系人列表看似简单,实际上它是一系列IM系统的社交关系确立动作的结果体现。

要想建立联系人列表,你可能需要实现以下逻辑:

  • 1)怎么能找到想要聊天的人?(需要实现随机查找?精确查找?)

  • 2)怎么决定要不要跟这个人聊?(需要实现对方的个人信息查看)

  • 3)开始发出好友请求;

  • 4)被请求的一方,还可以决定是“同意”还是“拒绝”(“同意”该怎么处理?“拒绝”又该怎么处理?)。


总的来说,联系人列表的建立,是一个IM系统聊天关系确立的表现,不可或缺。

▶ 2)聊天界面:


聊天界面看似很平常,实际它就是IM系统客户端的核心功能所在,所有主要的IM功能都是通过它展现。

它应该具备的能力有:

  • 1)各种聊天功能按钮:语音留言、图片、文字、表情、文件、实时电话、实时视频等;

  • 2)各种聊天消息显示:各种消息都有不同的UI显示元素和处理逻辑;

  • 3)流畅的使用体验:大量不同类型的消息显示时,不能卡顿;

  • 4)即时显示聊天消息:网络线程收到的消息,要马上在UI上显示出来;

  • 5)历史消息的加载:上次聊过的内容也得显示出来吧。


以上只是简单罗列,这看似简单的聊天界面,能把上面列表的事情做好,工作量也不小吧。

▶ 3)消息发送通道:

下图是一个典型的IM消息收发通道示意:


如上图所示,消息发送通道这个比较好懂,最浅显易懂的理解就是用tcp或udp,建立socket长连接,需要发消息的时候,wirte一下就过去了,好简单!

但,事情往往不是想象的这么简单:

  • 1)如何保证这条socket长连接时一直处于可用的状态?

  • 2)当socket长连接不可用时,用户此时发送的消息该怎么处理?

  • 3)怎么保证发送的消息不丢?

  • 4)怎么保证发送的消息不复重?

  • 5)怎么保证发送的消息乱序?

  • 6)当对方不在线时,发送的消息去哪了?

  • 7)发送的消息,能保证实时送到?


这么一说,事情还挺多(那不废话吗。。。)。

▶ 4)消息接收通道:

正如上节中的消息收发通道示意图所示,消息接收通道也很好理解,对方通过消息发送通道write的消息,我得收到并显示啊。

要实现一个可靠的消息接收通道,也并非易事:

  • 1)如何保证socket长连接通道能随时处于良好的边接状态(随时接收对方write的消息);

  • 2)当socket长连接断开时,对方发送消息该怎么实现?

  • 3)当socket恢复连接时,怎么恢复之前的聊天现场?

  • 4)当我收到对方的消息时,对方怎么知道我已经收到了?

  • 5)当重复收到对方的消息时,该怎么处理?

  • 6)当收到的消息时序有错乱,该怎么处理?


▶ 5)消息存储:

消息存储这个功能好理解,聊天的消息如果存储,下次再聊的时候就不知道之前聊过什么,做不到这一点,这个IM系统的聊天体验好不起来。

那么,哪些情况下需要进行消息存储呢:

  • 1)对方不在线时:聊天消息应该存储(这叫离线消息存储);

  • 2)对方在线时:聊天消息也要存到本地存储(这叫消息缓存);

  • 3)对方在线或不在线时:聊天消息都要存到服务端(用于实现多设备的消息漫游和同步)。


具体要存储的内容和时机也就上面这几样。

但技术落到实处,要做的事情同样少不了:

  • 1)离线消息该怎么多久?

  • 2)图片、短视频、大文件这类的离线消息,多媒体文件该怎么存(有可能量会很大)?

  • 3)当本地的消息积累太多时,怎么能保证本地存储的性能?

  • 4)当应用更新、升级或异常时,怎么能保证本地存储的完整性(不被破坏)?

  • 5)怎么能保证多设备消息能不丢、不重、不乱?


这么多需要考虑的内容,也挺让人抓狂。

下图是一个IM系统的典型存储架构设计,了解一下:


本图引用自《现代IM系统中聊天消息的同步和存储方案探讨》一文


▶ 6)消息未读数:


消息未读数?看起来也就是那个所有IM应用都有的未读小红点嘛。是的,看起来也好简单!

然而,消息未读数功能的实现也一样不简单:

  • 1)未读数是客户端实现还是服务端实现?

  • 2)会话未读和总未读怎么保持一致?

  • 3)多终端情况下,怎么保证未读数的一致性(我在这台设备上读没读,那台设备怎么知道的?)?


是的,看起来就这么简简单单的3件事,但深入思考一下,还真的简单不起来。


6、本文小结


IM系统的应用场景已经不单单是IM聊天应用这一种形态,它已经融入到互联网应用的方方面面,必竟谁都想自已的应用具备“实时”交互这种能力,因为体验太好了。

IM系统典型架构无非就是网络接入层、业务逻辑层、数据存储层,除开网络接入层,其它各层其实跟普通的应用系统看起来差别并不是太大。

IM系统的技术特点来说,就是实时性、可靠性、一致性、安全性,除了实时性对于多数应用来说并不关心,其它的指标也很好理解。

IM系统的功能组成上,联系人列表用于数据模型的建立、聊天界面承载了IM系统的终端展现、消息的收发通道用于实现“实时”这个特性、存储和未读数看似不是必须但用户体验上确必不可少。


本文在编写时参考了博客作者“鹿呦呦”和在线课程“即时消息技术剖析与实战”的相关资料,一并表示感谢。本文已同步发布于52im社区:http://www.52im.net/thread-3033-1-1.html