经典诗文自动生成设计与实现开题报告 您所在的位置:网站首页 生成古诗词的软件有哪些 经典诗文自动生成设计与实现开题报告

经典诗文自动生成设计与实现开题报告

2024-03-02 02:52| 来源: 网络整理| 查看: 265

经典诗文自动生成设计与实现

摘要:经典古诗文是中国文化史上一份耀眼的瑰宝,是自古以来人类不可或缺的精神支柱。随着时代的发展,人工智能的提出,单一的手动写诗已经不再满足于这个时代的需求,已经有不少的研究者在自动生成古诗文的路上下了不少功夫。本系统采用 B / S 架构设计,基于长短期记忆网络模型( LSTM )的神经网络结构,结合数据集,对自动生成诗文的模型进行构建。并给出了该模型生成效果的评估标准,最终完成经典诗文自动生成的设计与实现。

关键词: B / S架构;LSTM;数据集;人工智能

1文献综述

诗文自动生成早在人工智能出现初期就成为众多学者的热门研究对象之一,

国内外在这一领域已经有很多的成果。

1.1国外文献综述

在1959年,Theo Lutz用计算机创作了第一首德文诗歌[1]。Mnuring在他的论文中提出了一个完整的作诗机模型[2]。1962年,美国艺术杂志《 Horizon 》发表了一篇题为"一位美国新诗人登上诗坛:艾比的创作"的文章,其中艾比就是一位机器诗人。之后的几十年,众多诗文自动生成系统逐个出现,这些系统可以创作英文,德文,西班牙文,日文,韩文等不同语言不同形式不同风格的诗文。近年来随着人工智能的发展和自然语言处理技术的不断发展,诗歌自动生成系统也在逐步成熟。从随机词汇连接方法(其代表系统为 PeteKigannon 的 LYRIC 3025[4]),到基于模板的方法[5][6]  (单机系统代表 RACTER , PROSE , RETURNER , APPI 等,网络版的有 ELUAR , ALFRED 等),再到基于设定模板的方法( Ray Kurzweil 的 Cyberneit Poet 系统[7]和 ALAMO 小组的 Rimbaudelaires 系统[8]),以及到基于进化算法的系统(代表系统为 Levy 的 POEVOLVE [9]和 Manurung H . M .的 MCGONAGALL 系统[10])。

1.2国内文献综述

周昌乐等人在宋词生成上采用了遗传算法[11],把诗歌的生成当作状态空间搜索问题。系统首先随机地大量生成诗句,然后找专家制定的评估函数给诗句打分,选出高分诗句,再不断的完善,得到一首完整的诗歌。该系统不足之处在于诗句之间不连贯。并且遗传算法的诗歌生成模型会消耗大量的时间来人工定义诗句的评估函数。严睿等是从自动文摘技术中获得的灵感从而引入到诗歌生成中[12]。系统从用户输入的关键词,在诗歌语料库中检索出相关的词,根据诗歌的语义、结构、平厂押韵等条件聚类排序选出关键词,再根据约束条件优化替换词语得到算法最终生成诗歌。该方法在连贯性上有了一定的改良,但是其中几项重要指标极度依赖评估函数的质量,所以实现起来较困难。MSRA 的何晶和周明将诗歌生成看成一个统计机器翻译( Statistical Machine Translation , SMT )问题[13]。利用SMT 模型将原始语句翻译成目标语句,这个过程包含平仄押韵等约束。不断重复这个过程,生成一首完整的诗歌。作者还设计了一套人工评估标准,从流畅性、格律、连贯性和语义四个方面来判定一首诗歌的质量。而且中国台湾元智大学的罗凤珠教授提供了一个自动检查诗词格律的系统和一个帮助用户查找同韵字的字典[14]。李良炎探讨了中文诗词风格评价技术[15]。相比之前较为完善,虽然诗歌自动生成领域的研究已经很广泛但仍然存在某些方面的缺陷,不是很成熟。

2选题背景及其意义

在人工智能蓬勃发展的这个时代,深度学习作为人工智能的一个主要研究方法,自然语言处理(natural language processing)中的一个重要研究方向--自然语言生成(natural language generation)已经成为众多研究者的重点研究对象。

经典诗文自古就是人类抒发自身情感的一种方式,它不仅是一种精神上的支柱,更体现了各地方的文化文明,是值得我们去传承并且弘扬的。

但在现在这个各方面都在快速发展的时代,单纯的人工作诗已经不能满足并且激发人们的热情。为了满足人们对诗文创作方面的需求,人工智能便提供了一个很好的实现平台。关于诗歌自动生成系统目前国内外的研究者已经积累了很多的经验。但仍然还存在一些不足。

本文是对该内容的研究和探讨,希望通过对经典诗文自动生成机制的研究,构建较为完善的构建模型和系统,使其更加符合人类思维创作诗文,更加人工智能。

3研究内容

本论文主要研究的是:经典诗文自动生成系统的结构设计,在内部需要的模型基础是什么,和怎样将外部信息与内部模型连接沟通起来,形成一个动态可选择记忆的自动生成系统。

3.1 B/S架构设计

经典诗文自动生成系统采用的是B/S架构模式设计的,由三层结构组成,分别是表现层、逻辑层和数据层。表现层主要作用是用户的交互和最终结果的输出显示,逻辑层的作用是服务器实现客户端的相应请求的处理,数据层的作用是根据不同的请求对数据集进行操作和结果数据的保留。

在本系统中表现层:由两个界面组成:登录界面+实现界面(选择诗类型+搜索栏关键词可以是诗人+下面就是结果输出栏)。

逻辑层:系统是以LSTM模型作为实现基础,同时研究设计合理的评价函数。

数据层:数据集,将数据集作为训练集转为向量集与LSTM模型进行连接和沟通,将LSTM模型训练成将有用的信息保存起来留到下次使用,而没用的信息舍弃。如图3-1所示。

图3-1

3.2 LSTM模型

本论文设计了基于LSTM的经典诗文自动生成系统,利用长期短期记忆(LSTM)模型进行经典诗文自动生成系统的设计与实现[3]。

LSTM模型是由遗忘门、输入门、输出门组成,形成一个由非线性门保护的自连接记忆存储器单元的RNN。

遗忘门作用:控制输入x和上一层隐藏层输出h被遗忘的程度大小。

输入门作用:控制输入x和当前计算的状态更新到记忆单元的程度大小。

输出门作用:控制输入x和当前输出取决于当前记忆单元的程度大小。

如图3-2所示。

图3-2

3.3数据集

数据集是一种由数据所组成的集合,通常以表格形式出现,每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为一个变量,每个数值被称为数据资料。

本文的数据集收集:Github社区作者Sheng You开源的古诗文本文件poetry.txt 。在本系统中数据集将作为训练集转化为向量集完成本次研究的任务。

3.4 python

本系统是采用python工具进行设计与实现的。

Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。它提供了高效的高级数据结构,并且具有简单而有效地面向对象编程。Python的语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。

3.5 pytorch

pytorch是一款深度学习框架,使用深度学习框架有如下两个优势,1.减少编写代码的难度,降低深度学习的门槛,2.方便模型的应用和部署。本系统采用pytorch深度学习框架去研究。

pytorch是2017年由Facebook人智能研究院基于torch推出的一款开源深度这一框架。它是一个基于Python的可续计算包,不仅能够实现强大的GPU加速。同时还支持动态神经网络。pytorch使用起来很方便,特别适合深度学习项目的开发,适用于计算机视觉,自然语言处理,语音识别等众多研究领域。

3.6模型评估标准

人工评估、BLEU机器评估和模型生成时间效率评估。

4 工作特色及其难点,拟采取的解决措施

4.1工作特色及其难点

本系统是采用LSTM模型设计。相比于递归神经网络(RNN)在序列数据中得到广泛应用和具有学习时序关系的能力[16]。LSTM可以更好地学习长期依赖关系,解决了RNN由于梯度消失和梯度爆炸导致很难学习较长时间的时序关系。

该工作存在的难点在于整体的一个实现过程,包括模型的构建和代码的实现。可能还存在一些没考虑到的其他因素。

4.2 拟采取的解决措施

(1)设计基于LSTM的神经网络结构并进行模型训练。

(2)设计合理的古诗词评价函数。

5 论文工作量及预期进度

2022年11月--2022年12月:查阅文献资料、熟悉数据挖掘、深度学习与软件编程相关知识,完成文献翻译和开题报告,参加开题答辩。

2023年01月--2023年2月:研究预测模型与数据展示方法,确定总体设计方案。

2023年02月--2023年04月:撰写论文总体框架,进行软件编程。

2023年04月--2023年05月:完善毕业论文中各子模块设计、论文撰写,完成论文初稿。

2023年05月--2023年06月:毕业设计论文修改,参加毕业答辩。

6 预期成果及其可能的创新点

预期成果:一份开题报告、一份毕业设计论文、一个完整顺畅可运行的经典诗文自动生成系统和软件源代码包。

可能的创新点:将从LSTM模型输入特征和古诗文评价函数这两个方面的设计去思考。

 

参考文献:

Charles O . Hartman . Virtual Muse : Experiments in com - puter Poetry [ Mj . Wesleyan University Press ,1996.H . Manurung , G . Ritchie and H . Thompson . Towards acomputational model of poetry generation [ C ]// Proc . of theAISB -00 Symposium on Cr eative and Cuitural Aspects ofAI ,2001.姚晓梅.基于LSTM模型的音乐流派分类方法研究[D].导师:刘勇;肖翀.河南科技大学,2019.van Mechelen,M.V.computer poetry [EB/ OL].

http://www.trinp.org/Poet/comP/ComPoe.HTM.1992.

Hartman,C.O.Virtual Muse: Experiments in computer Poetry [M].Wesleyan University Press .1996.Boden,M.A. The Creative Mind : Myths and Mechanisms [ M ]. Weidenfeld and Nicolson , London , UK .1990.Kurzweil,R.Ray kurzweil’s cybernetic poet[EB/ OL].

http://www.kurzweilcyberart.com/poetry.2001.

Rubaud , J ., Lussonnal P , and Braffort , P . ALAMo : Atelier de lit ´ erature [ EB / OLD .assist ´ e par la math ´ ematique etles

http://indy.culture.fr/alamo/rialt/pagaccalam.html.2000.

Kempe ,V., Levy ,R., and Graci , C . Neural networks as fitness evaluators in genetic algorithms : Simulating human creativity [ C ]. In Moore , J . D . ad Stenning , K ., editors , Proceedings of the 23rd Annual Conference of the Cognitive Science Society , Edinburgh , UK .2001.Hisar Maruli Manurung.An evolutionary algorithm approach to poetry generation [ D ] University of Edinburgh ,2003.周昌乐,游维,丁晓君.一种宋词自动生成的遗传算法及其机器实现[J].2010.闫睿,姜华,Lapata M,等。基于生成摘要的中文诗歌自动生成算法研究[J] .中文信息学报,2013(3):379 - 379。何娟,周敏,姜丽。用统计机生成中国古典诗词

中文翻译研究进展[J] .中文翻译。2012。

罗凤珠,李元萍,曹伟政.《中国古代诗词格律自动检索与教学系统》[ J ].中文信息学报,1999,13(1):35-42李良炎,何中市,易勇,《基于词连接的中文诗词风格评价技术》[ J ].中文信息学报,2005.19(6):98-104.Campbell, A., V. Ciesielksi, and AK. Qin, Feature Discovery by Deep Learning for Aesthetic Analysis of Evolved Abstract Images, in Evolutionary and biologically inspired music, sound,art and design: 4th Interational Conference, EvoMUSART 2015, Copenbagen, Denmark,April 8- 10, 2015.2015: Copenhagen. p. 27-38.


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

      专题文章
        CopyRight 2018-2019 实验室设备网 版权所有