关于美国签证Check等待时间的数据分析

avatar 91905
叶大仙
55710
6
[align="left"]本来正要去UCI读第一年CS的PhD,结果被check了。在家等着无聊,就对http://www.checkee.info/上的check数据做了一个简单的数据分析。本人之前有厦大数学的本科学位,JHU统计的硕士学位,数据分析也算是老本行了。[/align][align="left"]使用的工具也是很传统的R-3.1.1,有空也能用Python重做一遍,但这个数量级的数据实在没区别。所有的图像都是用ggplot2 package画的。过程是先从HTML网页上摘取checkee的数据,转化成数据框,然后进行分析,数据清洁工作也没太大技术含量。样本是2009年到2013年在checkee info网站上用户登记的数据。我排除了那些有开始时间没有结束时间的incomplete样本,因为很可能用户后来没有登录网站完成check信息更新。最终我的样本容量为9297个用户数据,所以也不是什么大数据问题。[/align][align="left"]首先我们来关注不同月份check的等待时间:[/align][align="left"]
Preview
[/align][align="left"]本来我预期6、7、8三个月应该最繁忙(学生签证高峰期),但数据告诉我们6、7、9三个月更繁忙。我们能够看出8月份等待时间有着明显的降低,但是9月份又多出了一个礼拜时间。我认为这是十一长假导致了check时间变长。而后的十一月份等待时间的下降证实了这个观点。[/align][align="left"]然后我们来观察一下签证类型:[/align][align="left"]
Preview
[/align][align="left"]签证类型差距不大,没有超过一个星期的。F1签证的等待时间居中,但是高于H1签证,又与J1签证几乎持平。[/align][align="left"]然后是新签和续签的差别:[/align][align="left"]
Preview
[/align][align="left"]两者没有什么差别,都在四周左右。[/align][align="left"]签证地点:[/align][align="left"]
Preview
[/align][align="left"]我们发现不同大使馆的处理速度几乎是一样的,中位数均不超过30天。[/align][align="left"]本来我还相对专业进行相同分析,但是专业在网站上并没有给用户选项,而是让用户自己输入,导致专业名称非常混乱,不容易分析,于是后文仅对CS专业进行了可视化。[/align][align="left"]现在我们从看一下不同年份的check情况:[/align][align="left"]
Preview
[/align][align="left"]图中的Y轴为中位数。从这张图中我们可以看出,2009年年初表现出check时间非常长,我认为这跟网站刚成立,数据不够全面有关。但是我们惊人的发现2013年处理速度异常的慢。实际上,2011年中国留美人数157558,2012年194029,2013年235000呈现三级跳趋势。我个人认为,中国留美人数在当时已经超过了大使馆的运作负荷,从而直接导致2014年新签证制度的运行。[/align][align="left"]我们选取F1签证:[/align][align="left"]
Preview
[/align][align="left"]与上图没有太大差别。但是九月份的等待时间已经超过了八月份。[/align][align="left"]下面选取我关心的F1-CS专业的check数据:[/align][align="left"]
Preview
[/align][align="left"]今后我会在八月份回国!六月份千万不能回国![/align][align="left"]这篇文章只是一个非常简单地数据分析,无论是工具还是思想都非常直接,欢迎大家提供更多的想法,来帮助可能被check的同学![/align]
  • 2
6条回复