基于大语言模型的视障人群文档视觉问答指令生成方法和装置

    公开(公告)号:CN118410869A

    公开(公告)日:2024-07-30

    申请号:CN202410511790.3

    申请日:2024-04-26

    Applicant: 浙江大学

    Abstract: 基于大语言模型的视障人群文档视觉问答指令生成方法,其方法包括如下步骤:S110,基于公开文档数据集筛选候选文档;S120,对候选文档进行文字识别;S130,将文字识别结果处理为结构化文字信息;S140,根据结构化文字信息通过大语言模型生成面向视障人群问答指令数据。本发明提供的基于大语言模型的视障人群文档视觉问答指令生成方法,其中,所述方法通过筛选公开文档数据集,并通过其文字识别结果,构建结构化文字信息,并通过不同的面向视障人群的问答示例,利用大语言模型低成本高效率地生成了大量的文档视觉问答指令数据,改进了现有技术无法简单高效生成文档视觉文档指令数据的问题,从而帮助对面向视障人群的文档视觉问答模型的优化。

    一种基于区块链技术的文本生成式AI监管方法和系统

    公开(公告)号:CN116450786A

    公开(公告)日:2023-07-18

    申请号:CN202310222614.3

    申请日:2023-03-02

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于区块链技术的文本生成式AI监管方法,所述方法包括:S110:构建监管区块链网络;S120:在所述监管区块链网络上部署监管智能合约;S130:基于所述监管智能合约确定是否授权用户使用AI模型;S140:响应于授权用户使用AI模型,生成与之对应的文本信息;S150:将所述文本信息与用户信息存储至所述监管区块链网络中;S160:对所述监管区块链网络上存储的信息进行查询和分析。通过构建区块链网络,设计并部署监管专用智能合约,将用户信息、输入数据、AI输出数据存储至区块链上,并允许监管部门查询和追溯,改进了现有技术无法高效监管文本生成式AI所生成的内容的问题,提高生成式AI的透明度和可追溯性。

    一种基于词频逆文档频率的视频字幕显示优化方法和系统

    公开(公告)号:CN118317160A

    公开(公告)日:2024-07-09

    申请号:CN202410428196.8

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于词频逆文档频率的视频字幕显示优化方法和系统,所述方法包括:获取语料库;基于TF‑I DF算法计算语料库中的每个词的逆文档频率;获取音视频文件中的文本信息和时间戳集合;统计所述文本信息中每个分词的词频;基于所述语料库中的每个词的逆文档频率和文本信息中的词频计算所述音视频文件中每句话的理解成本;基于所述理解成本动态调整所述音视频文件中不同句子的显示时长。利用词频逆文档频率计算视频中每个语句的理解成本;根据理解成本大小顺序分段,根据不同的语句所处分段不同,动态调整语句的显示时间。由此降低听障用户在学习网络课程中的困难,减少听障用户因为字幕显示时间较短而导致频繁地拖动进度条回看的操作。

    一种基于背景文字增强的视频字幕生成方法和系统

    公开(公告)号:CN118317159A

    公开(公告)日:2024-07-09

    申请号:CN202410428195.3

    申请日:2024-04-10

    Abstract: 本发明提供了一种基于背景文字增强的视频字幕生成方法和系统,包括:基于人声检测模型确定视频信息中文字出现的时间戳集合;基于所述时间戳集合获取与之对应的视频画面;提取所述视频画面中的文字信息;对所述文字信息进行分词和词性标注;基于TextRank算法计算每个分词的得分;基于所述每个分词的得分以及与之对应的词性标注生成与之对应的词性标注列表;依据预设的分配比例选取不同的词性标注列表中的分词组成热词表;根据分词的得分排序等比例设置热词表中不同分词的生效权重;基于所述热词表和视频信息生成视频字幕。利用热词表和音频数据,通过语音识别软件获取视频字幕信息,通过以上流程从而达到减少人工干预且提高视频字幕识别准确率的效果。

    基于方差比的区块链分布式计算资源调度均衡方法

    公开(公告)号:CN115718661A

    公开(公告)日:2023-02-28

    申请号:CN202211100149.8

    申请日:2022-09-08

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于方差比的区块链分布式计算资源调度均衡方法,其中,所述方法通过分别获取每个分布式计算引擎的任务数量;基于所述任务数量生成原始资源分配原则;将每个分布式计算引擎所处理的任务进行聚类采样;基于所述聚类采样后的结果生成分布式计算引擎的变化方差比;基于所述变化方差比更新所述原始资源分配原则;验证所述更新后的资源分配原则;基于所述验证后的资源分配原则对分布式计算引擎进行资源分配。可以较好保证每个节点都有足够的计算能力,且尽可能减少计算资源浪费,从而帮助对区块链分布式计算资源进行调度均衡。

    基于增量计算的区块链层次化存储架构采样方法

    公开(公告)号:CN115687514A

    公开(公告)日:2023-02-03

    申请号:CN202211093178.6

    申请日:2022-09-08

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于增量计算的区块链层次化存储架构采样方法,包括:获取低层区块链中的原始数据;基于所述原始数据生成第一表征向量;将基于所述第一表征向量生成的第一特征向量以及与所述第一特征向量相对应的第一方差存储至高层区块链;获取低层区块链中的更新数据;基于所述第一特征向量和所述第一方差将所述更新数据按数据分布变化进行聚类;基于所述聚类结果利用增量计算方法将所述底层区块链的更新数据整合在高层区块链中。利用增量计算方法将低层区块链的更新数据整合在高层区块链中,保证高层区块链对低层数据区块链整体的覆盖性,同时在低层数据更新时及时选择合适的样本替代原有采样结果,从而帮助对层次化多模态数据存储架构优化。

Patent Agency Ranking