医学互联网研究杂志-中国健康消费者的声音:基于网络的医生评论的文本挖掘方法

原始论文

¹美国麻萨诸塞州波士顿大学管理科学与信息系统系

²马里兰大学决策、运营与信息技术系，学院公园，马里兰大学，美国

通讯作者:

郝海静，博士

管理科学与信息系统系“，

麻省大学波士顿分校

莫里西大道100号

波士顿，马萨诸塞州，02125

美国

电话:1 8572728162

传真:1 6172877887

电子邮件:haohaijing@gmail.com

背景:许多基于web的医疗保健平台允许患者根据自己的经验发布开放式文本评论，从而对医生进行评估。这些评论对其他患者来说是有用的资源，可以帮助他们选择高质量的医生，尤其是在像中国这样没有医生转诊系统的国家。分析如此大量的用户生成的内容来了解健康消费者的声音，引起了医疗保健提供者和医疗保健研究人员的广泛关注。

摘要目的:本文的目的是利用文本挖掘技术从基于网络的医生评论中自动提取隐藏的主题，以检查中国患者对他们的医生的评论，以及这些主题在不同专业之间是否存在差异。这些知识将帮助医疗保健消费者、提供者和研究人员更好地理解这些信息。

方法:我们对从中国最大的在线健康社区“好医生在线”平台收集的数据进行了双重分析。首先，我们使用描述性统计方法研究了2006-2014年的所有评论。其次，我们将著名的主题提取算法Latent Dirichlet Allocation应用于来自四个主要专业领域的7.5万多名中国医生的50多万篇文本评论，以了解中国健康消费者在网上对他们的就医情况的看法。

结果:截至2014年4月11日，在“好医生在线”平台上，314624名医生中，有112873名医生至少被审查过一次。在772,979篇文本评论中，我们选择了四个评论最多的专业领域:内科、外科、妇产科和儿科以及中医。在收到这四个医学专业评论的医生中，三分之二的人收到了两次以上的评论，在少数极端情况下，一些医生收到了500多次评论。在四个主要领域中，审稿人发现最受欢迎的话题是找医生的经历、医生的技术技能和对病人的态度、患者的普遍赞赏以及各种症状的描述。

结论:据我们所知，我们的工作是第一个使用自动文本挖掘方法来分析中国基于web的医生评论的大量非结构化文本数据的研究。根据我们的分析，我们发现中国的评论者主要集中在几个热门话题上。这与中国在线健康平台的目标是一致的，也体现了中国医疗卫生体系的健康重点。我们的文本挖掘方法揭示了一个新的研究领域，即如何使用大数据来帮助医疗保健提供者、医疗保健管理人员和政策制定者倾听患者的声音，针对患者的担忧，并在这个以患者为中心的护理时代提高护理质量。此外，在医疗保健消费者方面，我们的文本挖掘技术可以帮助患者在不阅读数千篇评论的情况下，更明智地决定看哪些专家，这是完全不可行的。此外，我们对中国和美国网络医生评论的比较分析也表明了一些文化差异。

中国医学医学杂志，2016;18(5):e108

doi: 10.2196 / jmir.4430

关键字

在线医生评论；医生评级；文本挖掘；中国健康消费者

近年来，通过基于web的平台查找关于医疗保健或医疗保健提供者的信息的情况一直在增加。皮尤研究中心(Pew Research Center)发布的《2013年健康在线报告》(2013 Health Online Report)显示，在过去一年里，约58%的美国成年人至少使用过一次互联网搜索与健康相关的信息。近一半(47%)的美国成年人在网上搜索过他们的医疗服务提供者，37%的人咨询过医生评级网站，7%的寻求医疗服务提供者信息的人在网上发表过一篇评论[1］．美国的一项新研究也发现，59%的受访者表示，在线医生评分对他们来说“有点重要”，而19%的受访者表示，在他们搜索医生时，评分“非常重要”[2］．同样，在荷兰，大约三分之一的荷兰人会搜索医疗服务提供者的评级[3.］．一项针对七个欧洲国家的研究显示，在使用互联网进行健康相关用途的人群中，超过40%的人在选择新医生时认为这些电子健康服务提供的信息很重要[4］．除了对使用医疗服务提供者在线评级的人口比例进行调查研究外，研究人员还研究了人们如何看待或评估这些在线评论。研究表明，评论的风格和数量也会影响患者如何评价这些在线评论，以及患者对收到在线评论的医生的态度[5］．

卫生保健研究人员对在线医生评分现象进行了定量研究。一项研究表明，大约17%的美国医生在互联网上进行了评级。其中，产科医生/妇科医生的评分是其他专科医生的两倍[6］．在德国，2012年，37%的德国医生在jameda网站上进行了评级，大多数被评级的医学专业是骨科医生、皮肤科医生和妇科医生[7］．在英国，国民健康服务选择网站对61%的家庭医生进行了评级，69%的评级显示患者会推荐他们的家庭医生。在较大的医疗机构、老年患者比例较低、贫困程度较低、人口密度较高以及非单独执业的医生更有可能获得评级。在较小规模的设施中服务但不是单独执业的医生，白人患者比例较高，人口密度较低，患者贫困程度较低的医生更有可能获得更高水平的推荐[8］．在中国，约37%在“好医生”平台注册的医生已被审查[9］．然而，一些医疗从业者或卫生保健研究人员认为，在线评论可能存在偏差，因为直言不讳的愤怒患者更有可能在网上给他们的医生打分。一项实证研究表明，在调查中获得较低评分的医生不太可能在网上获得评分，但在线医生评分与调查中的患者意见正相关，并且倾向于夸大评分范围的较高一端[10］．在中国，大多数定量评价(星级)是肯定的，88%的评价是医生的治疗效果，91%的评价是床边态度[9］．在美国，大多数在线评论都相当积极，在1-5分的范围内，平均得分为3.93 [6］．在德国，三分之二的评级都属于最佳类别(非常好)。7］．在英国，大多数(64%)国家医疗服务选择网站的在线评分是正面的[8］．

除了与评论相关的定量评级之外，还有大量关于医疗保健提供者的在线文本评论。它们可以帮助卫生保健提供者和研究人员更多地了解患者对护理的意见。与定量评分不同，文本回顾给予患者主观的灵活性和自由，让他们对自己的经历和担忧表达意见。在线评论分析已经在许多其他领域得到了研究。例如，挖掘产品评论在营销研究或管理科学领域非常普遍和成功，例如使用消费者生成的产品评论来分析人们的在线产品选择行为[11]，或市场结构[12］．然而，只有少数研究集中于使用文本挖掘技术来检查和分析这些大量可用的文本评论。美国之前的一项研究将潜在情绪分析纳入回归分析，并改进了州一级的健康结果测量[13］．英国的另一项研究将机器学习技术应用于对医院服务的评论，并表明评论可用于预测患者对医院绩效的意见[14］．根据作者的知识，只有一项研究采用了自动文本挖掘方法来捕捉医疗保健消费者讨论他们的医疗保健提供者的隐藏主题。他们特别分析了纽约市四个专业的在线医生评论:家庭/全科医生、牙医、妇产科医生和精神病医生。15］．然而，这些研究受到可用综述数量有限的限制。

在本文中，我们打算应用一种著名的文本挖掘方法，潜狄利克雷分配(LDA)，通过分析从中国最大的在线健康社区好医生平台收集的大型经验数据集，来研究中国患者对医生或医疗服务的看法。据我们所知，目前还没有关于中国健康消费者在网上对他们的医疗服务提供者的评价的实证研究，尽管中国拥有超过5亿的互联网用户，是世界上互联网用户最多的国家。16]并且已知有超过100万条关于中国医生的在线评论[17］．本研究探讨了以下研究问题:中国患者在网上如何评价他们的医生?这些主题是否因专业领域而异?卫生保健提供者、卫生保健管理人员或政策制定者能从这数百万份评论中学到什么?在中国卫生体制改革的背景下，这一点尤为重要。另外，中美两国的患者护理综述是否存在差异?

中国医生在线评论的现状

在过去的十年里，中国已经创建并广泛使用了几个在线医生评级平台。中医药论丛[18，于2013年12月创建，专注于对中医的评价。安排网上约会[19成立于2010年，专注于中国各地医生的在线预约，也是一个审查医生的平台。这些网站中，“好医生在线”[20.)(中文叫“豪代府”;“好”的意思是“好”，“医生”的意思是“医生”)是中国第一个在线医生评论平台，于2006年启动。好医生是国内最早让患者在多个专业领域对自己的医生进行评分和评论的在线平台，也是国内最大的在线平台，有超过30万名医生被评论，在线评论100万篇[17］．此外，它还为特定医生提供在线预约、远程会诊、患者-医生论坛和患者俱乐部等全面的在线健康相关服务。

“好医生”成立的目的是帮助中国的医疗保健消费者为他们的健康问题找到“好”医生。这一点尤其重要，因为中国的医疗保健体系已经发生了巨大变化，而自20世纪80年代以来，中国还没有建立起任何有效的转诊系统。在中国，大多数人没有初级保健提供者，中国患者通常会自我推荐他们负担得起的或他们认为好的提供者。21］．在互联网出现之前，中国消费者要么靠运气随机选择医生，要么靠口碑推荐。然而，许多人并没有患有同样健康问题的朋友，也不知道应该看哪位医生或专家来满足他们的健康需求。因此，中国消费者在选择“好”医生时面临许多困难。此外，中国和许多国家一样缺乏医生。2011年，中国每1000名居民拥有1.8名医生，美国为2.5名，英国为2.8名[22］．因此，在中国，不预约看病是极其困难的，在知名医院看病就更困难了。由于在线预约或电话预约在中国还不广泛使用，许多患者或其家属需要一大早去医院排队。

好医生平台

自2006年成立以来，好医生平台一直在收集有关中国医生的信息:人口统计信息、专业领域和技术职称，以及相关医院的隶属关系，如医院的名称、地址和级别。技术职称的评定实行全国统一的等级制度。它有四个级别——从初级到高级——从住院医师、主治医师、副医师到主任医师。平均每5年，一名医生就能在这个系统中提升一级。因此，职称主要表明医生的工作经验和技术水平，这也决定了患者的诊疗费。中国的医院等级是由一个政府机构——省一级的国家卫生部门——评估和确定的，评估标准是基于医院设施、床位数量、技术设备、护理质量、医生技能等[23］．

一旦医生的信息被发布在好医生网站上，患者就可以根据自己与这些医生的接触经历，在网上匿名评论这些医生。在这个网站上，人们可以从三个维度来评价他们的医生:两个定量指标和一个定性指标。这两项量化指标是对医生的治疗结果和床边态度的评估，分为5级，从“不满意”到“非常满意”。定性开放式文本审查可以是与医生相关的任何描述或经验。为了控制滥用、不适当或虚假的评论，那些在网上留下评价的人必须提供电话号码，只有网站管理员才能看到，这样网站就可以确认任何可疑评论的真实性。

数据

截至2014年4月11日，我们在该平台上收集了来自112,873名医生的773,279篇公开评论。共有来自全国3000多家医院的314624名医生在现场。因此，约36%的医生被中国患者评价或评论过，这与德国医生在线评论的比例相似，37% [7]，但高于美国，在美国只有17%的医生被评为[6］．

在数据清理后，比如删除信息不准确或不完整的评论，我们有731,543条评论有定量评级，772,979条评论有定性文本，731,264条评论有定量和定性措施。好医生网站包括9个不同的主要医学专业领域，加上一个被称为“其他”的，指的是所有其他不太常见的特殊领域表1)．在这项研究中，我们选择了排名靠前的四个专业领域进行分析:内科、产科(OB)/妇科(GYN)、儿科和中医，它们分别获得了约23%、13%、17%和12%的评论。他们也有大量的医生，分别约21%，19%，14%和11%的医生。表1显示骨科、肿瘤科、精神科和口腔科医生平均收到的评论数大于内科医生。但这些领域的医生数量远远少于内科。

表1。按专业领域划分的评论和医生数量。

专业领域	评论,n	评论,%	医生、n	医生,%	每个医生的评论数，n
肿瘤学	7372	0.95	1323	1.12	5.6
中药	90127年	11.66	12073年	10.21	7．5
妇产科和儿科	128762年	16.66	16575年	14.01	7.8
传染病	3205	0.41	486	0.41	6.6
内科医学	102441年	13.25	22473年	19.00	4.6
整形	3865	0.50	498	0.42	7.8
其他人	240099年	31.06	36281年	30.67	6.6
精神病学	6429	0.83	1056	0.89	6.1
口腔医学	16346年	2.11	2679	2.26	6.1
外科医生	174302年	22.55	24846年	21.00	7.0
总计	772948年	One hundred.	118290年	One hundred.	6.5

主题建模

主题建模是一种复杂的文本挖掘技术，适用于我们的研究任务，即通过识别好医生平台上的主题来了解中国在线医疗保健消费者的声音。主题建模是一种从文档集合中发现抽象主题的统计方法[24］．例如，如果一个文档包含流感作为主题，那么该文档很可能包含相关的单词，如“感冒”、“发烧”、“咳嗽”、“打喷嚏”等。如果一份文件是关于手术的主题，那么“疼痛”、“手术”、“外科医生”、“切口”等经常会以很高的概率同时出现。请注意，主题的名称是由研究人员根据出现频率最高的关键词进行抽象和总结的(例如“流感”或“外科手术”)，因为计算机算法只能发现哪些关键字在统计上聚类的模式，但不能总结出这些关键字所代表的主题。此外，文档通常混合了不同的主题。主题建模可以使用不同的算法以统计的方式捕获这些主题。我们使用LDA分析了中国消费者对其医疗服务提供商的评价。LDA已被广泛应用于各个领域，包括web挖掘[25]、视频分析[26，27]、垃圾邮件过滤[28]，以及自然语言处理[15，24，29，30.］．它是一个生成概率模型，最初是由[31]，如图所示图1．

β为每个主题词分布上的Dirichlet先验参数。α是每个文档主题分布上的Dirichlet先验参数。θ^(d)主题分发是否为文档d(例如，一篇综述)，以及z题目是word作业吗w在文件中。ϕ^(z)这个词的分布是主题吗z．w是“while”这个词吗D是文档的数量。N_d文件的字数是多少d,T是主题的数量。LDA模型假设文档的生成过程如下d=（w₁……w_nd),包含N_d词汇表中的单词由V不同的条款,w_我是我^th万人空道我=1，…，N_d．它包括以下三个步骤:

比例ϕ这个主题的单词分布z由ϕ^(z)~狄利克雷(β)．
比例θ文档的主题分发d是由θ^(d)~狄利克雷(α)．
对于每一个N_d(a)选择一个主题z~多项式(θ^(d))和(b)选择一个词w_我从一个以主题为条件的多项概率分布z：P（w_我|z，ϕ^(z)）

LDA中的主题数量必须预先确定。在本文中，我们将数据集分为两部分:90%的训练数据集和10%的测试数据集。训练后的模型在测试数据集上的复杂度决定了最佳主题数。为了使用LDA，我们需要解决的关键推理问题是计算文档中给定的隐变量的后验分布:P(θ， φ， z | w， α， β) = P(θ， φ， z, w | α， β)/P(w | α， β)。不幸的是，这个分布很难计算[32］．虽然后验分布不可能用于精确推断，但LDA可以考虑各种近似推理算法，包括变化逼近、吉布斯采样和期望传播。

汉语和英语有很大的不同:大约有3000个基本的和常用的汉字。一个汉字通常不能表达完整准确的意思。至少需要两到三个汉字的组合。因此，在本研究中，我们需要在直接应用LDA之前做一些预处理。我们首先采用了由LingPipe实现的汉字分割算法[33]来提取有意义的标记，包括删除非ascii字符、非中文字符等。所提取的标记可以具有从1到可能非常大的数字的各种长度。每个标记都被认为是一个原子实体，这意味着每个标记中的所有字符都不会被分开进行进一步处理。然后我们去掉无意义的单词，比如中文中的停顿词(如，of, I, we)，以及很多高频率的单词(如，doctor, physician, hospital)。最后，我们过滤掉只有一个汉字(没有意义)或有四个以上汉字(可能包含不止一个意义)的标记。在此数据清理之后，我们对每个专业进行以下两项分析:(1)计算每个唯一令牌的频率，(2)对四个领域中每个领域的所有医生的评论运行LDA算法，以找到前10个主题，每个主题都使用该主题内概率最高的10个单词表示。

描述性统计

图2显示所有四个专业领域的医生百分比与医生收到的评论数量的分布。我们发现大约36-45%的医生收到了1篇评论，36-39%的医生收到了2- 5篇评论，8-12%的医生收到了6-10篇评论，16-27%的医生收到了6篇或6篇以上评论。在极端的情况下，一些医生收到了500多份评论。从图2，我们还发现所有四个专业领域的分布模式相似。

图3显示2007-2013年综述量的分布。我们没有包括2006年和2014年的回顾，因为整个日历年的数据不完整。图3说明评论的数量一直在相对增加。每个医生的评论数量的趋势是相似的所有四个专业领域，在过去的几年里，如图所示图4．

表2显示回顾长度的描述性统计。如果我们使用句号、感叹号或问号等常规停顿来分割评论，那么每个评论平均有3-4句话涵盖所有四个专业领域。相比之下，美国患者的平均描述长度约为4句话[15]，中国患者的回顾时间似乎略短。但是，汉语的句子结构与英语不同。例如，一个中文句子可以很长，包含一个或多个用逗号分隔的主题，这在英语中很少见。因此，为了准确地理解复习的长度，我们检查了汉字的数量。一篇评论的平均中文字数在85到102个之间，相当于40个英文单词。根据作者出版的译著来看，中英文之间的翻译率通常为2比1，即20个汉字的句子可以翻译成10个英文单词的句子。或者如果你随机选择一个中文句子，把它翻译成谷歌，翻译率是相似的。表2显示评论的中位数长度约为60-70个字符。这表明超过50%的评论长度超过30个英文单词。在一些极端的情况下，内科学、妇产科和儿科可能会超过1700字。

表2。回顾长度的描述性统计。

	按常规塞子的数量			按汉字数量
	评论的平均长度	评论的中位数长度	评论的最大长度	评论的平均长度	评论的中位数长度	评论的最大长度
内科医学	3.3	3.	96	85	61	1766
手术	3.5	3.	81	95	66	1030
妇产科和儿科	3.6	3.	112	101	72	1730
中药	3.7	3.	77	102	74	1188

主题建模结果

基于LDA算法，我们确定了四个选定专业领域的前10个热门主题。由于篇幅所限，我们列出了5个最热门的话题，并将其翻译成英文。在专业领域中有几个重叠或相似的主题。每个主题的标题由作者根据LDA算法返回的关键字集总结出来。对于每个主题，我们只显示10个在该主题下具有较高概率的关键字。在表3-6，我们为所选的四个专业领域分别提供主题摘要、前10个关键词的对应英文翻译，以及每个主题的一个示例回顾。基于LDA模型的假设，每一篇综述都是不同概率的主题的混合。我们在一个主题下选择一个具有最大概率的示例评论。

表3。内科。

主题		例子
议题1:治疗效果
	关键字	现在，效果，总是，已经，更好，之后，显著，一次，一年，多年
	例子	我带我妈妈去看医生，她(妈妈)有这个问题超过10年了，但我们一直没有找到导致这个问题的原因。幸运的是，我们遇到了一个认识他的学生(医生)，我们拜访了他的名声，诊断出了问题，之后得到了很好的结果。
主题2:技术技能
	关键字	医术、职业操守、风度、高尚、卓越、超群、技术、伟大、服务、经验
	例子	刘胜云医生是一位优秀的医生，他的会诊过程非常彻底，他的态度非常好，技术过硬，有很强的职业操守。
主题3:注册的故事
	关键字	时间，门诊，专家，在线，因为，看到，咨询，今天，注册，访问
	例子	我为我妹妹登记了。这是极其困难的。我差点死在人群中，因为在登记窗口的人太多了。幸运的是，我拿到了一张挂号票。我妹妹不住在这个城市。如果她自己来注册，我想她永远也拿不到挂号票。这种药很有效。但服药后她的脸肿了起来。一开始医生说我们要在2个月后进行随访，所以明天早上我会再来和人群抗争。
话题4:床边态度
	关键字	耐心、礼貌、认真、负责、细心、有问题、谨慎、特别、每次都热情
	例子	刘医生不仅技术超群，而且对病人热情耐心，就像对待自己的朋友一样!他是我见过的最好的医生。
话题5:找医生的故事
	关键字	一、今年，发现，介绍，孩子，北京，后来，协和医院，去年，开始
	例子	我朋友给我介绍了这个医生，说这个医生治风湿病很好。他看了我的病历资料后给我做了诊断，说单靠药物可能不理想，然后介绍了干预医生，但是那里病人太多了，我没有时间多问。希望下次我有时间问你。

表4。手术。

主题		例子
话题1:床边态度
	关键字	病人，症状，严重，态度，问题，情况，谨慎，非常小心，负责，小心
	例子	李主任医师非常和蔼，非常细心负责，对待病人就像对待自己的家人一样，非常耐心，谨慎，而且他总是很和蔼，仔细检查，认真回答问题，我的手术非常成功。李主任医师是一位技术精湛、职业操守高的医生。
主题2:欣赏手术结果
	关键字	手术，成功，父亲，母亲，移除，住院检查，手术
	例子	我父亲三天前做了手术，手术前后，焦文杰主任医师和他的团队给了病人最舒适和细心的照顾。作为病人的整个家庭，我们看到了所有的关心，想从心底里说声谢谢!
话题3:一般的欣赏
	关键字	感谢，谢谢，你好，妈妈，全家人，你好，希望，健康，孩子，在这里
	例子	您那神奇的双手是一个奇迹，您那亲切的笑容如春天般温暖，您是病人的幸运星，真的很感谢您，廖建娜医生。祝福:好人有好日子过。
主题4:症状的描述
	关键字	因为，自我，知道，感觉，当，但是，总是，这个，什么，很多
	例子	我的心脏不好，去看了李医生，做了一些检查，然后我知道我有主动脉瓣膜和心房颤动的问题，然后我住在医院，吃我的心脏药物，直到我达到一定的条件，我做了手术。
话题5:找医生的故事
	关键字	时间，门诊，网上，发现，介绍，专家，看到，朋友，上海，通过
	例子	青岛所有有脑外科的门诊病人我都去过，后来一个朋友把焦主任介绍给我，焦主任给我做了耐心的讲解，让我们这些外行了解了症状和最好的治疗方法。由于预算紧张，焦主任医师为我设计了特殊的手术方案，以确保手术效果最好，成本最低。这深深地打动了我们。焦主任医师是一位值得信赖、尊敬的好医生。

表5所示。妇科/OB和儿科。

主题		例子
话题1:一般的欣赏
	关键字	感激，感谢，你好，希望，健康，健康，这，全家，妈妈，顺利
	例子	我非常感谢王主任医生，他治愈了我孩子白细胞减少的问题。良好的态度，正确的药物，花费更少。真的很感激。祝王主任医师身体健康。
主题2:注册的故事
	关键字	时间，在线，专家，因为，门诊，看到，今天，访问，因此，注册
	例子	很难通过注册，一周只有一天有10张注册票，(我)需要在5点排队注册，最后得到第18张票。一天只有20张票。医生很有耐心，给我检查得很仔细，平均能和一个病人谈15分钟。而且，药物也不贵。据说他是这方面的专家，希望这样的好医生能有更多的门诊时间。(一)相信他的技术能力。
话题3:治疗的故事
	关键字	考试，结果，知道，什么，什么时候，这个，什么，一次，其他
	例子	我的孩子突然得了喉气管支气管炎，在医院住了一个星期，一直咳嗽。每次我的孩子咳嗽，医生都会说我们需要检查哮喘。这次带孩子去做(医学)检查时，波医生很和蔼，也很明确地说，这不是哮喘，不需要做其他检查，只需要吃一点药，(让孩子)睡前吃(孩子什么药都吃不好)。只有两种药，每一种是半粒，我的孩子配合吃了(这个)药(以前有好几种药我的孩子很讨厌)，效果很好，非常感谢!优秀的技术能力和良好的职业操守!
话题4:找医生的故事
	关键字	总是，怀孕，一次，介绍，发现，很多，后来，经期，朋友，因为
	例子	因为省医院的朋友介绍，我去看了冯医生。我左侧有卵巢囊肿，骨盆积水，所以不能怀孕。服药一个月后，超声波显示这两个问题都得到了解决。冯医生是一位有父母之心的医生。但很多时候她太忙了，没有时间检查病人。后来我吃了3个月的盖斯特林酮胶囊。超声显示卵巢囊肿和骨盆积液都消失了。但是我的肚子左下还是有点痛，摸到左边的时候，我能感觉到那里有什么东西，和右边不一样，但是医生太忙了，只看了超声结果，没有检查。因为工作原因，我搬到了上海，到现在半年多了，上个月我感到痛经，上海人民医院检查诊断为卵巢囊肿。现在经过整个咨询和治疗时间，我可以说我筋疲力尽了。 Doctors at Shanghai said no medication for menstrual cramps. I want to go back to Guangdong for Dr. Feng, her work attitude and technical skills are good, as everyone can see.
话题5:手术的故事
	关键字	手术，子宫，住院，年复一月，康复，成功，肌瘤，出院，随访，发现
	例子	你好，我是你众多病人中的一个，自从我得了子宫肌瘤，我看了很多医生，他们都说我应该切除子宫，我收到了一个熟人的推荐。我是为名声而来，浙江人民医院的杜医生很优秀。

表6所示。中药。

主题		例子
话题1:床边态度
	关键字	耐心，症状，态度，严肃，谨慎，问题，仔细，情况，质疑，每一次
	例子	这个医生是一个非常可爱的医生，我的朋友陪我去看了他，有一次(我的朋友)看到这个医生在值班，(我的朋友)立刻拿到了挂号票，并说他会很耐心地解释一切。
主题2:技术技能
	关键字	为人处世，技艺精湛，职业操守，也，高贵，优秀，本，负责，超群，伟大
	例子	倪医生是一个真正有价值的好医生。他对病人态度很好，对病人很好，很体贴，技术过硬，经验丰富!我去过很多医院，看过很多医生，但是像倪医生这样具有高尚职业操守的医生是很难找到的。你可以去看看他，一旦你看到他，你就会知道一个好医生意味着什么!
主题3:症状的描述
	关键字	多年来，我自己，严重，因为，疼痛，症状，母亲，不能，针灸，走过去
	例子	感谢孙医生治愈了我妈妈多年的肩膀关节炎。也给了我很有针对性的治疗。现在，我又来找孙医生治疗。
话题4:找医生的故事
	关键字	中医，网上，找到了，中医医院，年月，当时，看到了，今年，北京，找到了
	例子	我在上海工作，经常胃病。上海的医生说这是“反流性食管炎”，我在上海的三甲医院吃了将近5年的西药和中药，但没有治愈，我不得不继续服药，这让我很困惑。我找到了南通中医院的季院长，于是我去南通中医院明星医生科找他。纪总给我做了胃镜检查，发现是“浅表性胃炎”。现在我已经用了他的西药和中药大约2个月了，我好多了。我现在很开心。
话题5:关心孩子的健康
	关键字	孩子，咳嗽，开始，儿子，女儿，感冒，宝宝，后来，每次，孩子
	例子	你好，胡博士!今天我要写一封迟来的感谢信。20年前我带我儿子去看他的呼吸系统哮喘，那时我儿子才2-3岁，经常感冒，咳嗽时有特殊的声音，一个月有2-3次咳嗽问题。但是见过你之后，总共大约3-4次，(中医和针灸)。然后这个问题就再也没有出现过，有时(他)可能会感冒，但再也没有咳嗽的问题了。我们全家都很感激你治好了我儿子的病。谢谢!我一直记得你的名字，如果我的同事或朋友的孩子有这个问题，我会把你介绍给他们。你真是个技术高超的医生。

表7所示。跨专业领域的主题比较(X表示对应专业领域下的医生评论主要描述该主题)。

	内科医学	手术	OB-Pediatrics	中药
治疗效果	X
技术技能	X			X
欣赏手术效果		X
治疗的故事			X
手术的故事			X
医生对病人的态度	X	X		X
注册故事	X		X
找医生的故事	X	X	X	X
一般的升值		X	X
症状描述		X		X
关心儿童健康				X

主要研究结果

我们在四个专业领域中发现了一些共同和不同的主题。例如，在表7，我们可以看到，在四个专业领域中，最常见的话题是“找医生的故事”，考虑到以下情况，这并不奇怪。首先，好医生平台的目标是帮助中国患者为他们的健康问题找到好医生或好专家。在这个平台上描述如何在评论中找到好医生应该是很常见的。其次，我们知道中国没有成熟的初级保健系统或专业转诊系统。这可能会给中国患者带来意想不到的困难，让他们不知道应该找哪位专家看病。最后，由于医生短缺，中国每千人有1.8名医生(美国为2.5名，英国为2.8名[22])，要在挂号系统中获得一张看病“票”总是很困难，这导致许多投诉。一些随机选择的例子表3-6还表示看病有多困难或医生有多忙。

我们的研究结果还表明，有些话题相当常见，而且涵盖了各个专业领域，例如“技术技能”和“床边态度”。这不仅是因为它们是患者护理的重点，而且是因为该平台引发了此类评论。好医生平台要求审稿人在撰写文本评论之前，根据这两个维度给出评分分数。“一般评价”和“症状描述”是跨专业领域的另两个常见主题。表中的所有其他主题都只在一个特定的专业中找到。例如，“治疗效果”在《内科学》中更常见。外科医生的评价主要集中在“欣赏手术结果”。“关心孩子的健康”更多地体现在中医专业的评论中，这可能表明中国父母更愿意带孩子去看中医，以避免西药潜在的副作用。

我们还对中国医生评论和美国医生评论进行了比较。从两者提取的主题有时不同，但对于相似的医学专业来说非常接近。例如，美国家庭/全科医生项下的评论更多地与“态度”和“能力”等主题相关，而中国患者更关注“床边态度”、“技术技能”和“治疗效果”。在美国的OB专业领域(中国的OB/GYN和儿科)，我们发现美国患者更多地谈论“态度”、“轶事”、“关注”和“建议”，而中国患者更多地关注各种话题，如“治疗故事”、“手术”、“找医生”和“一般欣赏”。我们还发现，如果美国的许多审稿人对医生的经验感到满意，他们会明确地推荐医生。这可能表明他们有意识地意识到其他患者可能会在以后阅读他们的帖子。对于中国患者来说，他们会用很多客套话直接称呼医生来表达对医生的感谢，有些人还会明确地展示自己的名字和电话号码，这可能表明他们希望医生通过评论来认可自己，以便下次得到更好的治疗。这些差异可能是文化差异造成的。此外，“attention”在美国的医生评论中也很常见。但在本研究中，我们并没有专门有这样的主题。 It may be included in “bedside manner” and “general appreciation.” Finally, American patients specifically discussed “cost” under the specialty of dentist, and “schedule” for psychiatrist [15］．我们没有包括这两个专业领域，因为首先，目前的好医生平台没有一个单独的类别叫做牙医。它被归入口服药物的范畴。其次，关于精神科医生的评论总数太少，1000名医生的评论只有6000篇左右。

限制

这项研究也有局限性。首先，使用LDA提取隐藏主题[34］．LDA主要基于相似主题下词语共现的频率。它可能无法识别一些被很少的审稿人提到的主题，例如一些新兴的主题。其次，我们的数据仅从好医生平台收集，这可能会导致数据源设置和我们的方法存在一定的局限性。然而，好医生是中国最大的网络医生评论初级平台。此外，我们想要注意的是，当患者在好医生平台上发表评论时，他们被要求将他们的电话号码留给网站管理员，以防任何可疑的评论需要核实。这一策略是为了防止任何不诚实的评论或自动的机器人工作。然而，由于这一特点，一些患者可能会有点犹豫，不愿做出负面评价。

结论

综上所述，网络医生点评平台是中国患者表达意见和分享经验的良好渠道。从这些用户生成的评论中提取的主题可以更好地了解患者发布的内容。它还可以帮助卫生保健政策制定者和卫生保健提供者监测和调整其政策或资源，以更好地为人民服务并提高卫生保健质量。

我们的研究有几个贡献。首先，据我们所知，这是第一个通过分析大量基于网络的医生评论来了解中国医疗保健消费者声音的文本挖掘研究。数据来自中国最大的在线医疗保健平台。其次，我们从超过50万份在线文本评论中发现了主题，并将它们在专业领域进行了比较。自动主题分析为患者提供了一种了解医生的方法，以帮助他们决定应该看哪位专家。它还有助于卫生保健提供者或卫生保健政策制定者了解患者的担忧或抱怨，从而调整他们的政策或资源，以更好地为人们服务，提高卫生保健质量。鉴于在线评论的数量正在急剧增加，让一个人阅读和分析所有已经发布的评论是不现实的。我们还比较了从中国医生评论和美国医生评论中提取的主题。最后，我们的实证研究表明，中国消费者更关心注册、医生的床边态度和技术技能等话题。

这项研究可以衍生出一些潜在的研究。首先，我们可以将这个主题建模研究扩展到所有专业领域的基于网络的医生评论，以便为医疗保健提供者和研究人员更好地了解消费者对不同医学专业的想法。其次，我们可以将这种文本挖掘技术应用于其他国家的类似评论，以确定是否存在跨文化差异。第三，进一步研究基于网络的医生评论与卫生保健专业人员提供的护理质量之间的关系将是有趣的。

致谢

感谢好医生平台创始人王航先生及其技术团队对本次研究的持续支持。

利益冲突

没有宣布。

Kadry B, Chu LF, Kadry B, Gammas D, Macario a .对4999名在线医生评分的分析表明，大多数患者对医生的评分较高。中国医学杂志，2011;13(4):e95。［CrossRef] [Medline］
Hanauer DA, Zheng K, Singer DC, Gebremariam A, Davis MM.公众意识、感知和在线医生评级网站的使用。中国医学杂志2014年2月19日;311(7):734-735。［CrossRef] [Medline］
Van de Belt TH, Engelen LJ, Berben SA, Teerenstra S, Samsom M, Schoonhoven L.医疗保健中健康相关信息和交流的互联网和社交媒体:荷兰普通人群的偏好。中国医学杂志，2013;15(10):e220 [免费全文] [CrossRef] [Medline］
Santana S, Lausen B, Bujnowska-Fedak M, Chronaki C, Kummervold PE, Rasmussen J，等。欧洲医生和病人之间的在线交流:现状和观点。中国医学杂志，2010;12(2):e20 [免费全文] [CrossRef] [Medline］
Grabner-Kräuter S，威格尼MKJ。洞察在线医生评论对患者决策的影响:随机实验。中国医学杂志，2015;17(4):e93 [免费全文] [CrossRef] [Medline］
高桂桂，McCullough JS, Agarwal R, Jha AK。医生质量报告的变化:分析患者在5年期间对其医生的在线评分。中国医学杂志，2012;14(1):e38 [免费全文] [CrossRef] [Medline］
Emmert M, Meier F.医生评级网站上的在线评估分析:来自德国公共报告工具的证据。中国医学杂志，2013;15(8):e157 [免费全文] [CrossRef] [Medline］
李志强，李志强，李志强，等。患者在互联网上对家庭医生实践的评级:使用和与英国国家卫生服务质量的常规措施的关联。中国医学杂志，2012;14(5):e146 [免费全文] [CrossRef] [Medline］
中国在线医生评论的发展:对中国最大的在线医生评论网站的分析。中国医学网络学报2015;17(6):e134 [免费全文] [CrossRef] [Medline］
高g，格林伍德B，阿加瓦尔R，麦卡洛J.发声的少数和沉默的大多数:在线评级如何反映人口对质量的看法?MIS季刊2015;39(3):565-589。
阿奇克N, Ghose A, Ipeirotis P.通过挖掘消费者评论获得产品功能的定价权。管理科学学报，2011;29(2):344 - 344。
聂泽，费尔德曼R，戈登伯格J，弗雷斯科M.挖掘你自己的业务:通过文本挖掘的市场结构监视。市场营销，2012;31(3):521-543。
Wallace B, Paul MJ, Sarkar U, Trikalinos T, Dredze M.在线医生评论的潜在因素和情绪的大规模定量分析。中国医学信息杂志2014;21(6):1098-1103 [免费全文] [CrossRef] [Medline］
Greaves F, Ramirez-Cano D, Millett C, Darzi A, Donaldson L.使用情感分析从在线发布的自由文本评论中捕捉患者体验。中国医学杂志，2013;15(11):e239 [免费全文] [CrossRef] [Medline］
Brody S, Elhadad N.在医疗服务提供者在线评论中发现突出方面。2010年发表于:AMIA 2010研讨会论文集;2010年11月13日至17日;华盛顿，第202页。
世界银行。URL:http://www.webcitation.org/6WWUrs3OY［WebCite缓存］
经济学人网站。URL:http://www.webcitation.org/6WWV4pi2N［WebCite缓存］
《中医药评论》。URL:http://www.zydp.org/[已访问2016-04-26][WebCite缓存］
安排网络约会。URL:http://www.guahao.com/[已访问2016-04-26][WebCite缓存］
好医生。URL:http://www.haodf.com/[已访问2016-04-26][WebCite缓存］
王晓明，王晓明，王晓明，王晓明。中国卫生服务提供的研究进展。卫生经济，2008年2月;17(2):149-165。［CrossRef] [Medline］
世界卫生组织《全球卫生人力统计》，2011年。URL:http://www.webcitation.org/6gutU5Jna［WebCite缓存］
国家卫生和计划生育委员会。医院等级管理评价。中国北京:国家卫生和计划生育委员会;1998.
Brody S, Elhadad N.在线评论的无监督方面情绪模型。2010年发表于:计算语言学协会北美分会会议(NAACL-HLT);2010年6月1日至6日;洛杉矶，CA第804-812页。
梅强，刘超，苏宏，翟晨。基于概率的网络日志时空主题模式挖掘方法。2006第15届国际万维网会议(WWW ' 06);2006年5月22-26日;爱丁堡，苏格兰，英国。
王军，李峰。基于时空词的人类行为类别无监督学习。In: Proc BMVC。2006年发表于:英国机器视觉协会(BMVC)2006年9月4日至7日;英国爱丁堡。［CrossRef］
王勇，王志强，王志强。基于贝叶斯模型的无监督活动感知。In: Proc CVPR。2007年发表于:计算机视觉与模式识别;2007年6月18日至23日;明尼苏达州明尼阿波利斯市。
陈志伟，陈志伟，陈志伟。网络垃圾邮件过滤中的关联潜狄利克雷分配。2009，第5届网络信息检索国际研讨会;2009年4月21日;马德里,西班牙。
博伊德- graber J, Blei .句法主题模型。:捏。2009年发表于:神经信息处理系统;2009年12月7日;温哥华BC。
Blei D, Griffiths T, Steyvers M, Tenenbaum J.集成主题和语法。发表于:神经信息处理系统，2005，神经信息处理系统;2005年12月7日至12日;加拿大蒙特利尔。
李国强，李国强。潜狄利克雷分布。机器学习研究，2003:993-1022。
多重超几何函数:概率解释和统计应用。美国统计协会杂志1983:628-637。
李文杰，李文杰，李文杰。一种基于压缩的中文分词算法。计算语言学2000;26(3):375-393。
唐杰，阮旭，梅青，张敏。基于后验收缩分析的主题建模限制因素研究。2014年发表于:第31届国际机器学习会议(ICML);2014年6月21-26日;北京,中国。

G·艾森巴赫(G Eysenbach)编辑;提交14.03.15;S Santana同行评审;作者意见27.07.15;修订版本收到14.09.15;接受20.02.16;发表10.05.16

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

中国健康消费者的声音:基于网络的医生评论的文本挖掘方法