基于Kafka与Spark的实时大数据质量监控平台 2019年6月8日 Spark 0条评论 132次阅读 0人点赞 微软的ASG (应用与服务集团)包含Bing,、Office,、Skype。每天产生多达5 PB以上数据,如何构建一个高扩展性的data audit服务来保证这样量级的数据完整性和实时性非常具有挑战性。本文将介绍微软AS…