会员天地

会员动态 | 2025年05月20日
DeepSeek引爆访问安全刚需,“大模型访问脱敏罩”提出大模型安全新解法~

数字化浪潮下,数据安全风险日益凸显,尤其是机构在对外访问开放大模型时,敏感数据泄露问题频发,成为制约行业发展的瓶颈。近日,网御星云发布大模型访问脱敏罩MADA Mask(Model Application Desensitization Access Mask),为访问侧、用户应用侧提供专业的数据脱敏防护。MADA Mask重点解决机构对外访问开放大模型的数据安全问题,在确保机构全员高效使用开放大模型的同时,有效保障敏感数据安全。

MADA Mask采用实时数据检测与脱敏技术,通过在企业用户与大模型的数据交互中,对输入、输出内容及上传文件进行实时识别、脱敏和行为阻断管理,有效防范数据泄露风险,助力企业实现安全合规的数据治理目标。

DeepSeek企业数据交互面临的核心威胁

随着大模型(如DeepSeek、豆包、通义千问等)在企业、政府、医疗等领域的深度应用,其推理和解读分析能力正面临敏感数据保护的严峻挑战。机构用户在输入或上传数据时(提示词、文字信息,附件的文件、文本等)可能包含个人隐私、企业敏感信息、医疗健康数据等内容,若未脱敏直接输入大模型,将面临以下风险:

数据泄露:大模型的训练或推理过程可能记录敏感信息,通过模型输出、缓存或第三方接口间接泄露。

违规利用:威胁者可能通过“提示词注入”诱导模型返回敏感数据,或利用大模型生成伪造内容(如虚假公文、医疗报告等)。

合规风险:违反《数据安全法》《个人信息保护法》等法律法规,面临巨额罚款与法律责任。

因此,MADA Mask在用户与大模型之间建立“数据脱敏缓冲区”,实现数据脱敏、秘密阻隔,确保数据真实价值的同时,系统性降低数据泄露风险,保障数据安全合规。

企业级DeepSeek部署方案

DeepSeek爆火后,各行业机构正积极推进DeepSeek等大模型的落地应用。当前主要存在四种典型部署模式:

第一种是全私域部署,即在机构内部部署满血DeepSeek或其他全功能大模型。该方案虽能有效控制数据泄露的直接风险,但投入成本相对较高。

第二种是公共大模型访问开放部署,即机构允许内部员工自由访问外部大模型。该方案投入少、起步快,但数据泄露风险暴露面最大,最危险。

第三种是公共大模型访问罩部署,即机构为内部员工访问外部大模型提供访问代理,同时部署数据安全和其他应用安全保护措施。这样可以在极少的投入下,使机构全员获得大模型应用收益。这种部署方式和前两种部署方式并不互斥。

第四种是混合大模型访问体系化部署,即基于AI-R-IAM身份管理、业务分割、网络分域、数据分域的复杂部署方式,该模式适用于大型机构的深度应用环境。

对于多数机构而言,采用第三种方案是较优选择:鼓励所有员工、所有部门以松散的方式访问公共大模型服务,在机构边界或云上部署MADA Mask大模型访问脱敏罩。

MADA Mask应用场景角色分析

1.机构内普通大模型访问者的体验

角色:企业员工、业务部门需通过大模型完成日常任务的人。

核心需求:

(1)无感知脱敏:在正常使用大模型(如数据分析、报告生成)时,无需特意手动处理敏感信息,系统自动完成内容脱敏。

(2)效率保障:脱敏过程不影响工作流程,上传文件或输入文本时实时处理,避免因安全操作导致任务中断。

(3)结果可信度:脱敏后的模型输出需保留业务价值(如统计趋势、逻辑结论),避免因过度脱敏导致信息失真。

典型使用场景示例:

市场部门员工:上传包含客户信息的市场调研报告,系统自动隐去客户姓名、联系方式,仅保留行业、规模等非敏感字段供模型分析,生成市场策略建议。

2.机构内数据安全管理者的体验

角色:企业CSO、数据合规官、IT安全团队等负责全局数据安全的决策者和运营者。

核心需求:

(1)全链路可视性:从数据输入到模型输出的全流程监控,确保敏感信息“零暴露”。

(2)灵活策略管理:根据业务场景动态调整脱敏规则(如按部门、数据类型、模型类型定制策略)。

(3)审计与溯源能力:系统记录所有数据交互行为,支持快速定位风险并满足合规审计要求。

(4)根据业务发展及脱敏保密要求的变化,相关规则和策略可以不断升级迭代。

典型使用场景示例:

数据安全管理者的一天:

(1)上午:查看仪表盘中的“昨日风险摘要”,发现客服部门有3次未脱敏对话记录,通过日志溯源定位到新员工操作失误,立即推送培训通知。

(2)下午:收到系统自动生成的《季度合规报告》,直接提交法务团队用于外部审计。

(3)傍晚:根据“威胁热力图”发现某部门xx敏感词频次上升,调整脱敏策略,将“部分掩码”升级为“全文替换为模拟数据”。

MADA Mask核心能力

1.敏感数据智能围栏

系统运用多模态识别引擎技术,能够快速扫描上传文件与输入内容,无论是身份证号、银行卡号等常见个人信息,还是企业合同中的商业信息都能精准定位,并支持金融、医疗等行业定制化规则库。同时,系统具备“脱敏缓冲区”技术,对需保留语义的敏感信息(如合同关键条款)实施动态替换,实现数据可用性与安全性的平衡。

2.数据脱敏技术

系统采用数据替换、数据加密、数据泛化、数据扰动、数据删除等技术手段,能够根据数据类型和业务需求,灵活制定数据脱敏规则,既保障用户输入和上传文档时对敏感数据安全脱敏,也不影响大模型分析效能。针对数据脱敏可能导致的可用性下降问题,系统采用数据脱敏增强技术,充分利用生成对抗网络GAN、变分自编码器VAE等技术生成与敏感数据相似的合成数据,再通过上下文补全技术,利用行业知识库和语言模型,恢复因脱敏导致的语义缺失,有效弥补数据脱敏中的丢失信息,提升大模型训练效果。

3.内容智能阻断

系统运用NLP技术与算法,实时深度扫描输入内容,一旦精准检测到高风险敏感信息,便毫秒级触发内容输入阻断功能,拦截敏感内容,从源头杜绝数据泄露风险。

4.全链路审计

系统构建了大模型访问过程中全链接审计体系,精确记录细微操作,从而生成详尽且具有极高价值的行为审计日志。通过记录操作时间、执行人员、操作内容及结果等关键信息,为安全事件溯源与处置提供可靠依据,有效支撑安全体系持续优化。

典型部署方式

方式1,本地网关形态:MADA Mask逻辑串行部署于企业网络边界出口,覆盖公域大模型服务(如DeepSeek、通义千问等)和私域大模型,为用户提供智能化数据脱敏服务,确保上传数据安全。

方式2,SAAS化代理网关形态:MADA Mask逻辑串行部署于公有云上,覆盖公有云SAAS化大模型服务(如DeepSeek、通义千问等),为用户提供智能化数据脱敏服务,确保上传数据安全。

典型行业应用场景

1.医疗行业

病历文件上传场景:医院在进行科研项目、远程医疗会诊等工作中,可能需要将患者病历上传至大模型进行分析。系统对病历文件的患者姓名、身份证号、医保卡号、详细病史等敏感信息进行精准脱敏,确保患者隐私安全。

临床诊断辅助场景:医生输入患者症状描述等数据上传大模型时,系统即时对文本中敏感信息脱敏,避免患者隐私泄露。例如,将具体家庭住址模糊化处理,仅保留所在区域信息,为大模型提供安全可用数据,助力精准诊断。

医疗大数据分析场景:医疗机构利用大模型对海量医疗数据进行分析挖掘,以发现疾病流行趋势、优化治疗方案等。系统对上传数据进行严格脱敏,在保护患者隐私的同时,确保分析数据的有效性。

2.政府行业

快速办公场景:在处理各类行政审批、政策调研等工作时,会收到大量企业和公民上传的文件,如企业财务报表、个人申请材料等。系统可在文件上传入口处自动识别敏感信息(身份证号、银行账号等),采用掩码、替换等方式进行脱敏处理,确保大模型分析中敏感信息安全。

深度应用场景:政府不同部门间常需共享数据并借助大模型进行联合分析。系统可在数据共享前进行全面脱敏(如年龄、性别),同时过滤个人身份信息,实现业务需求与数据安全的平衡。

3.商业企业

二次分析场景:在企业内部,客户资料、财务报告、HR资料文档可能包含员工薪资、客户敏感信息等内容,上传文档到大模型时,系统自动扫描文档,识别敏感信息进行脱敏处理,确保企业核心数据安全。

营销策略场景:CRM系统中存储了大量客户信息(联系方式、购买偏好、消费金额等),在利用大模型分析客户行为、制定营销策略时,系统将对上传的客户数据进行脱敏。例如,电话号码进行掩码处理,消费金额按照区间划分,在确保客户隐私安全的前提下,保留数据商业价值以支持精准营销分析。

网御大模型访问脱敏罩(MADA Mask)将输入控制、数据脱敏和文件脱敏等核心技术融入典型的大模型应用访问场景,构建安全可信的人机交互体系。系统实现了“人-模交互”中业务价值与数据可信保护的平衡,重新定义AI时代的安全交互范式,确保AI应用场景下的数据安全与合规性,推动智能交互迈向更高层次的安全与信任。

(文章封面由AI技术生成后人工编辑,侵删)


请填写正确的姓名及联系方式,方可报名

姓名:
手机号:
公司名称:
*多人报名需上传参会人名单
提交

电话: 028-83045803

手机号: 028—83045803

QQ: 2635843428

E-mail: 2635843428@qq.com

地址: 四川省成都市金牛区沙湾东二路1号智业·世纪加州A座15A16号