作者风格分析器

Author Style Analyzer

一个基于先进自然语言处理技术的综合性系统,用于分析写作风格、识别文本作者,并生成模仿特定作者风格的新文本。

项目概述

本项目旨在应对数字时代验证文本来源的挑战,特别是在信息消费日益碎片化 和大型语言模型模糊人机界限的背景下。我们运用先进人工智能系统,提取作家的写作风格,提供工具来分析写作风格、识别文本的可能作者(使用微调的BERT模型),并生成模仿特定作者风格的新文本(使用定制训练的生成模型,基于GPT-2和SeqGAN)。系统还集成了DeepSeek API用于性能比较。

核心功能

作者风格训练

训练模型以识别不同作者的写作风格。

作者风格识别

使用微调的BERT模型分析文本样本以识别可能的作者,并能区分已知作者与“未知作者”风格。

风格化文本生成

使用基于GPT-2和SeqGAN架构定制训练的模型,生成模仿特定作者风格的新文本。

作者风格比较

比较不同模型生成的文本,包括与DeepSeek API的集成比较。

数据集与方法论

基于古腾堡计划等来源的文学作品数据集进行训练,采用滑动窗口、样本平衡 等先进技术处理文本。

交互式界面

用户友好的Streamlit网页界面,提供所有功能的简易访问。

聊天机器人集成

通过会话界面与风格生成器交互,创建沉浸式的作者风格体验。

项目演示视频

以下是本项目的详细演示视频,展示了作者风格分析器的各项功能和使用方法:

支持的作者

Agatha Christie
Alexandre Dumas
Arthur Conan Doyle
Charles Dickens
Charlotte Brontë
F. Scott Fitzgerald
Gabriel García Márquez
Herman Melville
Jane Austen
Mark Twain

功能演示

作者识别示例

"我从未见过如此充满细节的犯罪现场,"福尔摩斯慢慢地说道,他的眼睛扫过那些微妙的线索,对普通人来说这些线索都是不可见的。"注意那支铅笔的位置,华生,还有地毯上的那个微小的折痕。它们不仅告诉我们凶手是谁,还告诉我们他为什么要这么做。"

识别结果:此段文本的写作风格与 Arthur Conan Doyle 最为相似。置信度:89.7%

风格特征:详细的观察描述、福尔摩斯标志性的分析方法、以及面向华生的解释性对话,这都是柯南·道尔笔下福尔摩斯探案系列的典型特征。

文本生成示例

提示:以简·奥斯汀的风格描述一场乡村舞会

伊丽莎白小姐不得不承认,尽管她初到达时对梅里顿舞会抱有些许保留,但此刻的场景确实令人愉悦。房间布置得恰到好处,既不过于奢华以至于令人不适,也不过于简朴以至于显得寒酸。乐队演奏着优雅的曲调,而宾客们则以最得体的方式遵循着舞蹈的节奏。她注意到宾利先生面带微笑地与众人交谈,赢得了所有在场者的喜爱;而达西先生则站在远处,神情冷淡,似乎认为整个场合都不值得他的注意。

风格分析:生成的文本成功捕捉了奥斯汀的社会观察风格,包括对场合的细致描述、人物关系的微妙描绘、以及典型的社会阶层互动方式。

注:根据我们的评估,此定制生成器在模仿目标作者风格方面通常优于通用大语言模型。

聊天机器人对话示例

用户: 你能以马克·吐温的风格讲一个关于密西西比河的故事吗?

作者风格聊天机器人: 我可以告诉你,密西西比河有她自己的脾气,就像一位不愿受人约束的老太太。我记得有一次,我和老吉姆乘着一艘简陋的木筏顺流而下,那是个雾气缭绕的清晨,河面上的雾气厚得能用叉子叉起来。我们看不见十英尺以外的东西,全凭那条古老河流的善意来引导我们。突然,我们听到远处传来一声汽笛,紧接着是水面的震动——一艘蒸汽船!它像一头失控的野兽冲向我们。我们划桨的样子,活像两只受惊的鸭子拍打翅膀。最终,木筏撞上了岸边,我们滚进了泥里,像两只刚出炉的姜饼人被裹上了巧克力糖衣。密西西比河那天教会了我们敬畏,因为在她的水域上,人类的计划不过是水面上转瞬即逝的涟漪罢了。

开始体验

想要尝试作者风格分析器的强大功能吗?访问我们的GitHub页面获取源代码,或访问Hugging Face查看模型!