在这篇博客中,我们将介绍我们的新系统 “实时 SIC”,并向您展示我们的实时 SIC 系统如何改变行业分类,增强经济分析和业务数据准确性。
SIC 代码问题
标准行业分类 (SIC) 代码用于根据企业的主要活动对其进行分类,但其分类因其模糊性、不准确性和误导性而受到批评。主要问题包括:
SIC代码分配
选择 SIC 代码通常出于方便,一家公司最多可以选择 4 个 SIC 代码,但问题是 白俄罗斯电报号码数据库 没有强制措施来确保它们的准确性,这通常导致公司选择的代码不能准确描述他们的工作,并且对于错误选择没有任何惩罚。
例如,Facebook、Google UK Limited 等公司被归类为 SIC 代码“其他商业支持服务 nec”(82990)
谷歌硅谷总部
“其他”类别的模糊性
SIC 代码中的“其他”类别经常被过度使用,且缺乏针对性,这使得准确分析数据变得颇具挑战性。例如,像亚马逊和 Facebook 这样的大公司被归类为“其他”商业支持服务。您可以在此处阅读更多相关信息: SIC 代码作为行业分类依据存在缺陷 (thedatacity.com)
这些不准确的信息经常会扭曲经济分析,例如,尽管英国不能种植水稻,但疫情过后,英国“种植水稻”的公司数量却显著增加。
数据城如何解决这个问题?
为了准确地将公司分配到最合适的 SIC 代码,许多公司需要重新分类。数据城将利用其机器学习平台,根据公司在其网站上的声明,将公司分类更新为最合适的 SIC 代码。我们将这种新的 SIC 分类解决方案称为实时 SIC (RSIC)。
虽然 ONS Classify AI正在测试利用机器学习进行 SIC 重新分类的概念,但“数据城”的方法是独一无二的。我们将在机器学习过程中使用各个公司的综合网络文本,将它们重新分类为正确的 SIC 代码。
显示并验证流程的 RSIC 示例
我们已经举了一些例子来解决我们之前提到的问题以及我们的 RSIC 系统如何更好地解决这些问题。
以下是 RSIC 列表中美发和其他美容护理(96020)公司的 SIC 部分分布
Aesthetics (Leicester) Limited,一家美发沙龙,被归类为“其他信息服务” - 63990,而使用 RSIC,我们能够将其重新归类为美发 SIC 代码。
这一流程有助于我们将任何被误放至其他不相关 RTIC 的美发公司放到它们应该在的地方。
示例 2:
沉浸式现实 是一个专门使用先进的激光投影、手势控制和声音技术创建交互式多感官学习环境的平台,目前被归类为“其他商业支持服务活动”(82990),但根据 RSIC,它们被归入“现成的交互式休闲和娱乐软件开发”(62011)
沉浸式现实是一个专门创建交互式、多感官学习环境的平台
为什么是 RSIC 而不是 RTIC?
对于没有相关SIC分类的新兴行业,RTIC一直是最佳替代方案,因为它可以让行业专家更精确地定义行业。然而,SIC代码仍然是包括ONS在内的各个机构广泛使用和确立的分类系统。
RSIC 旨在通过根据公司在其网站上声明的业务内容分配代码并跟踪其随时间的变化来解决SIC 代码的局限性。它通过将传统分类与机器学习相结合,提供了一种平衡的方法。虽然RSIC 无法取代 RTIC,但它们通过提高 SIC 代码的准确性,提供了一种改进的 SIC 代码方法。