数据尽职调查之毕马威
随着互联网时代的不断发展,各类互联网企业通过业务模式和IT技术的不断创新,正得到资本的青睐。但以流量和收入作为主要估值指标的互联网企业,也面临着巨大的业绩增长和持续融资的生存压力,因此企业内部往往存在业绩刷量和数据造假的“源动力”。
投资人VS互联网企业:一场资本投资的博弈
在竞争日趋激烈、涉及垄断和不正当竞争案件不断增多的市场环境下,互联网企业往往面临极大的经营压力,部分公司会选择通过数据造假来粉饰业绩。近些年来,“用户造假”、“内部刷单”、“机器刷量”等问题不断被媒体披露。部分互联网企业在寻求发展的同时,俨然将“数据造假”作为一个实现业务“增长”和应对尽职调查工作的重要手段。
一方面,部分企业的指标数据和行为数据造假手段不断升级,仅通过传统的尽职调查手段已经越来越难以了解业务实际运营情况并发现异常数据;
另一方面,如今的资本投资行为越来越趋于谨慎与安全,在投资决策时,投资人关注的一个重点就是互联网企业的用户行为和内部数据是否全面且真实可靠?
互联网企业VS尽职调查:是魔高一尺还是道高一丈?
由于互联网企业运营大多依赖于信息系统,海量交易和用户行为数据描绘了企业主要运营和盈利模式,这也使得互联网企业财务数据向业务运营数据的可追溯性变得比传统企业更难以实现。因此,以系统稳定性和可用性评估、核心业财指标趋势变化分析为主要切入点的传统尽职调查,已经很难满足投资人对于互联网企业经营数据真实性和投资风险评估所提出的要求了。
根据我们的观察,互联网企业业绩造假模式的演变经历了两个主要阶段:
互联网企业早期通过直接伪造、编造系统数据或系统日志,快速提升核心业务指标数据,其特点是完全没有业务支撑,是在没有任何实际业务开展的情况下,完全通过IT手段在数据库中虚构交易数据。由于没有开展实际运营,虚假数据与真实数据缺少整体逻辑关系,在数据验证过程中仅需通过简单的逻辑场景验证即可识别出这类造假行为;
随着数据造假“产业链”的逐步成熟以及舞弊行为反排查手段的“日臻完善”,互联网企业逐步开始通过人工或机器模拟用户行为的方式在业务端进行业绩“注水”。也就是说,所有交易都是从前端发起,真实存在,但这些交易并非来自真正的客户。
这类造假模式模拟真实用户行为,更符合实际业务场景和逻辑,使得传统的IT尽职调查难以有效认定其造假行为。
毕马威结合丰富的尽职调查实践经验与数据分析方法,全面升级互联网企业IT尽职调查的模型、工具与方法论,能够有效帮助投资人全方位识别和评估目标公司业绩造假风险,对其数据真实性给与客观、公正的评价。
“千篇一律做尽调” VS “有针对性的开展IT尽职调查”
传统尽职调查往往依靠一套固定的流程开展工作,忽略了目标公司的行业特点和运营模式,因而调查结果也无法全面覆盖投资人所关注的重点和风险点。
毕马威认为互联网企业的IT尽职调查不应千篇一律,应根据目标公司所属行业有重点地进行IT风险和异常行为分析,比如对于电商平台来说,尽调应重点关注用户购买的真实性、用户复购率和潜在的订单刷单等数据及行为;对于服务类平台则应重点关注IT算法的有效性、平台系统的稳定性和用户的真实性等数据及行为;而对于游戏行业,应重点关注用户转化率、活跃用户真实性和游戏内自充值等数据及行为。
“局限于收入类数据” VS “关注核心IT数据”
传统尽职调查往往更关注与收入相关的指标类数据,缺少对目标公司的行为数据的分析,因而难以发现此类数据造假可能带来的潜在风险。
毕马威认为,在针对互联网企业开展尽调工作时,应对用户行为数据以及可能会对公司收入和商誉带来不利影响的IT数据进行真实性分析,判断数据的合理性,包括用户评论数据、用户点击量和用户留言数据等。
“趋势分析” VS “数据模型分析”
传统尽职调查往往通过趋势分析定位异常数据或异常趋势,容易忽略不同维度数据间的内在联系,因而难以准确刻画用户行为并发现异常数据。
毕马威在IT尽职调查中,一方面对于指标类数据的趋势和异常场景进行深入分析;另一方面也会利用数据分析模型及算法,从多种维度进行异常数据判别,并根据异常行为的不同类别,调整算法及模型,从而准确、有效地定位异常行为范围。
1、利用聚类分析定位平台雇佣水军刷单行为
传统刷单行为往往具有定频、大额和批量的特点,但随着尽职调查手段的不断完善,平台刷单行为也出现了相应“升级”,例如雇佣专业水军进行刷单操作。刷单的专业水军往往是一批真实用户,虽然可能每个人/账号的刷单金额并不大,但所有交易金额汇总后也可能会对平台整体收入带来较大影响。目前市场上还出现了“线下”(QQ群或微信群)沟通,“线上”(目标公司平台)刷单的虚假购买行为。与机器刷单相比,水军交易具有非定频、单笔订单金额和订单量都比较小的特点,因此也更难以识别。
针对水军刷单,毕马威通过用户画像对刷单行为的特征向量进行深入分析,并通过聚类算法对交易数据进行“群划分”,将交易数据中具有疑似刷单特征的数据全部归类为数据群,最后对此类数据群进行分布分析和重点排查,最终合理定位水军刷单行为。
▲资料来源:毕马威分析
2、利用离群分析与文本相似性检测定位刷量用户
传统的尽职调查主要围绕收入数据进行分析,不会特别关注用户的“刷量”行为。但对于互联网企业来说,用户使用量、留言数和评论数等非直接交易数据也能够从侧面反映出企业的经营状况和发展前景,因而此类数据也是投资人和业内人士的关注焦点。
为确保互联网公司与用户行为相关的非直接交易数据的真实性,毕马威甄选能够对目标公司潜在收入带来重要影响的行为数据(如:评论数、广告点击数、留言数等),针对这些数据进行用户离群行为分析并识别出脱离整群的极端值数据;此外,毕马威团队还会针对评论和留言等信息进行文本相似性检测,以判断是否存在利用机器人或数据爬虫进行数据搬运的行为;第三,毕马威团队还能够在识别异常行为的基础上,进一步追踪到目标公司用户并定位该用户生命周期内的全部行为,分析这些行为是否会对企业估值和投资人决策带来影响。
▲资料来源:毕马威分析
3、利用置信算法定位指标中的异常数据
尽职调查中的一个重要工作是通过观察指标或转化率的变化情况,判断一类行为或公司业务未来发展趋势。尽职调查人员对趋势中的极端变化一般较为敏感,这是因为在数据真实的前提下,极端数据往往具有重大的预警作用。但工作人员往往会在一个增长的趋势中忽略前期数据的剧烈变化,从而忽视了指标数据异常蕴含的业务运营风险。
毕马威采用置信算法为趋势分析制定异常点“标尺”,在对指标数据进行曲线拟合的基础上,通过算法自动生成置信区间,对趋势中的异常变化自动预警,从而及时、有效地识别趋势中的异常波动,为投资人的分析与决策提供科学依据。
▲资料来源:毕马威分析
两个典型案例
在为某知名投资机构开展的某教育平台IT尽职调查项目中,毕马威团队通过数据交叉匹配和画像分析发现目标企业所提供的业绩数据中,有很大比例是通过内部刷单形成的,最终该投资机构放弃了这笔交易。
在另一个案例中,毕马威团队在针对某行业领先的电子商务平台开展的尽职调查工作中,通过集中度和聚类分析识别出部分平台商户和客户勾结进行刷单的情况,并为投资人匡算出虚高数据范围和涉及金额所占比例,为投资人准确估算目标企业价值,降低投资风险提供了有力依据。
毕马威团队
毕马威中国拥有超过300人的专业IT尽职调查团队,配备大量拥有丰富大数据分析从业经验的专业人才,近年来成功协助投资人开展了近百个互联网企业的IT尽职调查项目,识别出大量数据造假行为。
毕马威希望能够充分利用多年积累的知识体系、技术能力和业务实践经验,协助投资人有效识别目标IT企业的投资风险,去伪存真,为资本市场健康发展保驾护航!
摘自 毕马威 公众号 2018.11.13
数据尽职调查之毕马威
IT审计学院
会员积分:570
随着互联网时代的不断发展,各类互联网企业通过业务模式和IT技术的不断创新,正得到资本的青睐。但以流量和收入作为主要估值指标的互联网企业,也面临着巨大的业绩增长和持续融资的生存压力,因此企业内部往往存在业绩刷量和数据造假的“源动力”。
投资人VS互联网企业:一场资本投资的博弈
在竞争日趋激烈、涉及垄断和不正当竞争案件不断增多的市场环境下,互联网企业往往面临极大的经营压力,部分公司会选择通过数据造假来粉饰业绩。近些年来,“用户造假”、“内部刷单”、“机器刷量”等问题不断被媒体披露。部分互联网企业在寻求发展的同时,俨然将“数据造假”作为一个实现业务“增长”和应对尽职调查工作的重要手段。
一方面,部分企业的指标数据和行为数据造假手段不断升级,仅通过传统的尽职调查手段已经越来越难以了解业务实际运营情况并发现异常数据;
另一方面,如今的资本投资行为越来越趋于谨慎与安全,在投资决策时,投资人关注的一个重点就是互联网企业的用户行为和内部数据是否全面且真实可靠?
互联网企业VS尽职调查:是魔高一尺还是道高一丈?
由于互联网企业运营大多依赖于信息系统,海量交易和用户行为数据描绘了企业主要运营和盈利模式,这也使得互联网企业财务数据向业务运营数据的可追溯性变得比传统企业更难以实现。因此,以系统稳定性和可用性评估、核心业财指标趋势变化分析为主要切入点的传统尽职调查,已经很难满足投资人对于互联网企业经营数据真实性和投资风险评估所提出的要求了。
根据我们的观察,互联网企业业绩造假模式的演变经历了两个主要阶段:
互联网企业早期通过直接伪造、编造系统数据或系统日志,快速提升核心业务指标数据,其特点是完全没有业务支撑,是在没有任何实际业务开展的情况下,完全通过IT手段在数据库中虚构交易数据。由于没有开展实际运营,虚假数据与真实数据缺少整体逻辑关系,在数据验证过程中仅需通过简单的逻辑场景验证即可识别出这类造假行为;
随着数据造假“产业链”的逐步成熟以及舞弊行为反排查手段的“日臻完善”,互联网企业逐步开始通过人工或机器模拟用户行为的方式在业务端进行业绩“注水”。也就是说,所有交易都是从前端发起,真实存在,但这些交易并非来自真正的客户。
这类造假模式模拟真实用户行为,更符合实际业务场景和逻辑,使得传统的IT尽职调查难以有效认定其造假行为。
毕马威结合丰富的尽职调查实践经验与数据分析方法,全面升级互联网企业IT尽职调查的模型、工具与方法论,能够有效帮助投资人全方位识别和评估目标公司业绩造假风险,对其数据真实性给与客观、公正的评价。
“千篇一律做尽调” VS “有针对性的开展IT尽职调查”
传统尽职调查往往依靠一套固定的流程开展工作,忽略了目标公司的行业特点和运营模式,因而调查结果也无法全面覆盖投资人所关注的重点和风险点。
毕马威认为互联网企业的IT尽职调查不应千篇一律,应根据目标公司所属行业有重点地进行IT风险和异常行为分析,比如对于电商平台来说,尽调应重点关注用户购买的真实性、用户复购率和潜在的订单刷单等数据及行为;对于服务类平台则应重点关注IT算法的有效性、平台系统的稳定性和用户的真实性等数据及行为;而对于游戏行业,应重点关注用户转化率、活跃用户真实性和游戏内自充值等数据及行为。
“局限于收入类数据” VS “关注核心IT数据”
传统尽职调查往往更关注与收入相关的指标类数据,缺少对目标公司的行为数据的分析,因而难以发现此类数据造假可能带来的潜在风险。
毕马威认为,在针对互联网企业开展尽调工作时,应对用户行为数据以及可能会对公司收入和商誉带来不利影响的IT数据进行真实性分析,判断数据的合理性,包括用户评论数据、用户点击量和用户留言数据等。
“趋势分析” VS “数据模型分析”
传统尽职调查往往通过趋势分析定位异常数据或异常趋势,容易忽略不同维度数据间的内在联系,因而难以准确刻画用户行为并发现异常数据。
毕马威在IT尽职调查中,一方面对于指标类数据的趋势和异常场景进行深入分析;另一方面也会利用数据分析模型及算法,从多种维度进行异常数据判别,并根据异常行为的不同类别,调整算法及模型,从而准确、有效地定位异常行为范围。
1、利用聚类分析定位平台雇佣水军刷单行为
传统刷单行为往往具有定频、大额和批量的特点,但随着尽职调查手段的不断完善,平台刷单行为也出现了相应“升级”,例如雇佣专业水军进行刷单操作。刷单的专业水军往往是一批真实用户,虽然可能每个人/账号的刷单金额并不大,但所有交易金额汇总后也可能会对平台整体收入带来较大影响。目前市场上还出现了“线下”(QQ群或微信群)沟通,“线上”(目标公司平台)刷单的虚假购买行为。与机器刷单相比,水军交易具有非定频、单笔订单金额和订单量都比较小的特点,因此也更难以识别。
针对水军刷单,毕马威通过用户画像对刷单行为的特征向量进行深入分析,并通过聚类算法对交易数据进行“群划分”,将交易数据中具有疑似刷单特征的数据全部归类为数据群,最后对此类数据群进行分布分析和重点排查,最终合理定位水军刷单行为。
▲资料来源:毕马威分析
2、利用离群分析与文本相似性检测定位刷量用户
传统的尽职调查主要围绕收入数据进行分析,不会特别关注用户的“刷量”行为。但对于互联网企业来说,用户使用量、留言数和评论数等非直接交易数据也能够从侧面反映出企业的经营状况和发展前景,因而此类数据也是投资人和业内人士的关注焦点。
为确保互联网公司与用户行为相关的非直接交易数据的真实性,毕马威甄选能够对目标公司潜在收入带来重要影响的行为数据(如:评论数、广告点击数、留言数等),针对这些数据进行用户离群行为分析并识别出脱离整群的极端值数据;此外,毕马威团队还会针对评论和留言等信息进行文本相似性检测,以判断是否存在利用机器人或数据爬虫进行数据搬运的行为;第三,毕马威团队还能够在识别异常行为的基础上,进一步追踪到目标公司用户并定位该用户生命周期内的全部行为,分析这些行为是否会对企业估值和投资人决策带来影响。
▲资料来源:毕马威分析
3、利用置信算法定位指标中的异常数据
尽职调查中的一个重要工作是通过观察指标或转化率的变化情况,判断一类行为或公司业务未来发展趋势。尽职调查人员对趋势中的极端变化一般较为敏感,这是因为在数据真实的前提下,极端数据往往具有重大的预警作用。但工作人员往往会在一个增长的趋势中忽略前期数据的剧烈变化,从而忽视了指标数据异常蕴含的业务运营风险。
毕马威采用置信算法为趋势分析制定异常点“标尺”,在对指标数据进行曲线拟合的基础上,通过算法自动生成置信区间,对趋势中的异常变化自动预警,从而及时、有效地识别趋势中的异常波动,为投资人的分析与决策提供科学依据。
▲资料来源:毕马威分析
两个典型案例
在为某知名投资机构开展的某教育平台IT尽职调查项目中,毕马威团队通过数据交叉匹配和画像分析发现目标企业所提供的业绩数据中,有很大比例是通过内部刷单形成的,最终该投资机构放弃了这笔交易。
在另一个案例中,毕马威团队在针对某行业领先的电子商务平台开展的尽职调查工作中,通过集中度和聚类分析识别出部分平台商户和客户勾结进行刷单的情况,并为投资人匡算出虚高数据范围和涉及金额所占比例,为投资人准确估算目标企业价值,降低投资风险提供了有力依据。
毕马威团队
毕马威中国拥有超过300人的专业IT尽职调查团队,配备大量拥有丰富大数据分析从业经验的专业人才,近年来成功协助投资人开展了近百个互联网企业的IT尽职调查项目,识别出大量数据造假行为。
毕马威希望能够充分利用多年积累的知识体系、技术能力和业务实践经验,协助投资人有效识别目标IT企业的投资风险,去伪存真,为资本市场健康发展保驾护航!
摘自 毕马威 公众号 2018.11.13
20-04-14 08:00
3789
0
回复
暂无评论