赶紧UQQ上发消息告诉邱亮重点查这台服务器的运行情况,经过分析定位这台服务器的一个端口异常,没有起来。紧急重启了服务,就都正常了,告诉他不要慌。
运维告警平台没有做监控这个端口,所以运维部门的同事,没有看见这个问题。
线上客服人员一片忙碌到下班的时候,世界才安静下来,照例,刘菁菁各种一通问,张明杰又找到负责手机APP开发的周强,为什么不是保存域名,而是保存一个IP地址,原来是为了增加一个历史记录的功能,改进来的问题。
一口老血喷出,苍天啊,我得罪了谁。
菁菁,你以后直接对接朱权就行了,不要直接问我,这些我真搞不定。
咦,不对啊,他俩最近关系还行,没有以前那么亲密了,我好像成为他俩的中间人了。
晚上自然是在公司吃了盒饭,把最近的故障报告都写了,发给公司的高层,回到家已经是晚上12点之后,倒头就睡。
但是就睡不着,脑子里在想,我是不是应该离职了,这个岗位我已经干不动了,又想到林美云来给我打盆洗脚水就更好了。
恩,顺便在给我按摩下肩部,恩,顺便…
在胡乱的臆想中,昏沉沉的睡着了。
搞了这么多的问题,第二天周六晚上连续作战,把版本推上线,凌晨五点才回去睡觉,等张明杰醒来的时候,已经快下午一点了,赖床了一会,起来刷牙洗脸,到楼下去吃午饭。
在餐厅等餐的时候,刘菁菁给他发微信说,公司老板祝山涛,针对我们的近期的几次平台故障,需要进行内部的批评,张明杰说行吧,就按规章流程走吧。
心里一丝的无奈袭来,不知道怎么样,批评也对吧,毕竟公司的规章制度在那呢;
但要批评吧,整个团队干成这样,伤了很多人的心,又暗自下决定“要通报批评,就批评我吧,我下面的小伙伴们,不能批评”
林美云也就被通知过来,了解了前因后果之后,发了个初稿,让大家一起看下,刘菁菁的是等周一高层例会讨论一下,作为项目经理张明杰,测试主管秦园也被邀请参与了。
秦园在UQQ上发了消息给张明杰说“今晚难熬啊,我又要去承担各方的怒火了”
“放心,还有我呢,咱俩一起,一个项目经理把控不足,一个是测试不到位,漏了问题发布到线上”
“开发是肯定没有问题,因为谁写的代码,都有Bug”秦园哈哈一笑
….
林美云初稿给朱权审核之后,初步定下来的故障主要责任是测试,运维,开发。
因为朱权一直提问,线上出了这个故障,测试团队为什么没有把这个问题测出来,运维的同学监控实在不到位,响应处理太慢,开发人员编码考虑不周全,上级也没有细致的评审代码。
张明杰在内心是很无奈的,整个项目组在拼死累活的干了这么多,还要被通报,谁写的代码没有缺陷呢?谁做测试,能把所有的问题测出来,谁家的运维能没有故障。
业界的阿里巴巴,还有腾讯每年也会出一次故障呢。
周一晚上讨论就两个议题,第一个是把发版本的新需求全部暂停了,再次把历史遗留问题,之前评审不修改的问题,再次翻出来确认是否要修改,不用等到下个版本,因为这些都是炸弹,不知道什么时候,在线上又爆炸了。
这个很快就达成了一致,无非就是要去说服各方我们延迟发版本了,刘菁菁和朱权顶住前方的压力就行了,第二个议题就热闹了,通报批评哪些人?
销售总监蒋楷舟说,“这个严重的事故肯定要通报,否则严重影响公司的形象,对内来说,也影响我们中心的产品线形象,对于具体的技术细节,以及在哪个环节出错了,这个开发主管鲁永讯,还是要给出具体原因,也不用藏着掖着,大家都是自己人,探讨出问题,我们在商量对策,下一步在看怎么改进计划”。
张明杰在心中骂道,你又不懂技术,你在一边讲大话。
张明杰心想:“你知道二进制是是什么吗? ”
接下来是产品总监鲍文斌说:“这些问题是不是可以避免的,我看了有几个是简单错误,这个要提出批评,另外那个几个原因比较深,我看就不通报批评了,还是内部谈话训诫一下就好了”。
毕竟鲍文斌之前也是研发出身,不会乱扣大帽子
周言道:“原则上对于用户有感知的批量事故,我们还是要通报批评,如果没有人出来承担,或者下属因为能力问题不能承担,就让他的上级来承担….
一番站在道德制高点的话演讲下来,毫无毛病,毫无违和感。”
张明杰在眼睛瞪着他们,看他们一个个述说着,仿佛终于找到一个出口,之前销售业绩达不成,跟研发没有关系,现在线上连续出了几次故障,研发是跑不掉了吧。
朱权道:“秦园你具有说下,测试这次是哪遗漏了,有些简单问题就没发现,尤其是手机APP的那个,发出去的版本,怎么能是写IP呢,不应该是域名的吗”
秦园没有好回答什么,都认了这些问题,测试不到位。
因为来之前,在UQQ上已经沟通过了,这个APP上写IP的问题,是在一次讨论会上菁菁定的,原因嘛,现在已经不知道当初为什么这样的设定了,因为好久了,那个接入服务器鬼知道现在才出故障啊,否则早就发现了。
然后开始激烈的争论,定通报批评的规则在一通争吵之后,也顺便定了通报的人员
通报批评人员:“主要责任人项目经理张明杰,测试主管秦园;次要责任人是刘菁菁和朱权负管理责任”
看了这个通报名单,呵呵一笑,开发这些模块的人,或者他们的组长,竟然啥事没有,项目经理和测试主管果断扛起了这个大锅。
次要责任就是没有责任,挂个名而已。
当第二天通报批评发出来的时候,整个项目组就沸腾了,讨论了热火朝天,甚至在路上听见两人在说,这以后都不敢开发代码,有严重软件缺陷,就要上报批评。
测试的同学就更慌了,拿着卖白菜的钱,操着卖白X的心。
张明杰也没有解释什么,总算没有把底下干活的人通报上去,都是领导层把锅背走了。