访问大型网站,输入www.hzpady.com网站后几秒钟,您在网页上看到了什么具体的内容? 实际上在舞台上工作了一分钟,在舞台上工作了十年,背后发生了很多事情,今天一起来看看吧。
1 .在ie中输入域名后,首先访问DNS
首先,根据智能DNS的作用,发现得到的IP地址因不同的源,例如电信、移动、联通的用户而不同。 这确保了从第一步开始访问网站的速度。 如下图所示,通信联络用户在用同一DNS解析后,访问不同的目标IP地址的页面。
注:智能DNS实际上需要域名提供商或您自己的DNS支持。
2 .访问网页时,web服务器生成PV、UV数据
打开主页时,web服务器生成日志,网页与PV (页面视图)相对应。 相同的IP地址只生成一个UV(Unique Visitor )。 访问此站点的多个页面时,一个UV支持多个PV。 对于购物网站,PV值应该更小,以便用户可以在多个网站上订购。
3、哪个web服务器向你提供服务,需要由LVS负荷分散器来决定
根据LVS (例如F5、Nginx )的判断,从前几十台服务器中选择一台web服务器提供网页分析服务。 LVS可以根据轮询、权重、源IP Hash等“心情”来决定,选择哪个服务器? 选中后,web服务器将在一段时间内提供连续服务。
4、在web服务器之前一般有CDN的成功
您可以从https://img.alicdn.com查看网站源代码(如taobao.com )和静态资源(如图像)。 这个域名实际上是taobao的CNAME指定地址的。 因此,实际的图像等资源进行着CDN服务,其他的动态资源依然进行着taobao.com的正常的服务路由。
注意:如果用户需要使用CDN服务,则站点的CNAME必须指向提供CDN服务的提供商的智能DNS。 通过调度智能DNS,将您的静态资源请求发送到最近的CDN服务器。
5、在网页搜索栏中输入“最新消息”,启动灵活的搜索服务
“最新新闻”是自动分词写作的,如“最新”和“新闻”,从灵活的搜索服务器数据库中搜索这两个词语最多的文章,并推荐这些文章排行榜。 实际的搜索引擎也是这个原理。
6、记录你所有的点击动作、输入内容、停留时间,成为数据分析源
你的全部动作都记录在背后的web服务器的log日志中,采用MongoDB和HBase这样的文件类型的数据库,可以作为后期非实时计算的数据源。 关于实时交易型的数据,通过Storm等流计算将结果保存在Oracle、Mysql等数据库中,通过DataView可视化插件实时地在大画面上进行显示(蚂蚁双方11的大画面也从该方法来)。
出现了一个网站的结果,上面的简介是一个非常简单的过程,实际的过程还在等着我们继续学习。