Python分析无人驾驶汽车在桂林市文旅行业推广的问卷

【项目背景】

通过市场调研、文本分析、访谈和问卷调查等方法,探讨:

  1. 网民对无人驾驶汽车出行服务的态度。
  2. 无人驾驶安全员的行业背景。
  3. 不同人群在旅游时的交通选择偏好。
  4. 游客及当地居民对桂林市文旅路线的交通满意度。
  5. 乘客对无人驾驶汽车的满意度。
  6. 桂林市文旅路线推广无人驾驶汽车是否会优化桂林旅游交通体验及其影响因素。

【相关代码】

import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import LatentDirichletAllocation as LDA
import matplotlib.pyplot as plt
from scipy.stats import chi2_contingency

# 假设我们有一个包含问卷数据的CSV文件
data = pd.read_csv('survey_data.csv')

# 数据清洗:移除缺失值
data_clean = data.dropna()

# 文本分析:使用LDA模型提取主题
vectorizer = CountVectorizer(stop_words='english')
lda = LDA(n_components=3, random_state=0)
lda.fit_transform(vectorizer.fit_transform(data_clean['comments']))

# 可视化主题
pyLDAvis.enable_notebook()
vis = pyLDAvis.gensim_models.prepare(lda, vectorizer, data_clean)
pyLDAvis.display(vis)

# 交叉表和卡方检验:分析不同人群的交通选择偏好
contingency_table = pd.crosstab(data_clean['age_group'], data_clean['preferred_transport'])
chi2, p, dof, expected = chi2_contingency(contingency_table)

print(f"Chi-squared test results: chi2={chi2}, p={p}, dof={dof}")

# 满意度分析:计算不同交通方式的满意度
satisfaction_scores = data_clean[['waiting_time', 'vehicle_cleanliness', 'driver_attitude']].mean(axis=1)
print(f"Average satisfaction scores: {satisfaction_scores.mean()}")
 

【代码说明】

  • 数据导入与清洗:

使用Pandas库读取名为"survey_data.csv"的CSV文件,加载问卷数据。

对数据进行清洗,通过dropna()方法移除包含缺失值的行,存储在data_clean中。

  • 文本分析(LDA模型):

使用Scikit-learn库中的CountVectorizer进行文本向量化,将文本数据转换成词频矩阵。

使用Latent Dirichlet Allocation (LDA) 模型对文本数据进行主题提取。

通过LDA模型的fit_transform方法拟合并转换文本数据,将其应用到data_clean['comments']列中。

  • 可视化主题(pyLDAvis):

调用pyLDAvis.gensim_models.prepare方法准备可视化数据,用于展示LDA模型的结果。

最终通过pyLDAvis.display方法展示生成的交互式可视化主题图。

  • 交叉表和卡方检验:

使用Pandas的crosstab方法创建交叉表,分析不同人群(按照'age_group')的交通选择偏好('preferred_transport')。

通过chi2_contingency方法进行卡方检验,计算卡方值(chi2)、p值(p)、自由度(dof)和期望频数(expected)。

  • 满意度分析:

计算各个满意度指标(等待时间、车辆清洁度、司机态度)的平均分数。

将三个满意度指标的平均分数进行均值计算,作为整体满意度得分。

需要注意的是,代码中使用的一些库和函数如pyLDAvis、gensim_models需要提前导入或安装。整体代码结构为数据处理、文本分析、可视化、统计分析和结果展示。

civilpy:Python数据分析及可视化实例目录940 赞同 · 36 评论文章​编辑

civilpy:Python通过某上市企业经营业绩预测股价走势0 赞同 · 0 评论文章​编辑

civilpy:Python实时追踪关键点组成人体模型0 赞同 · 0 评论文章​编辑

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.kler.cn/a/274754.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

00_coolprop_in_matlab在Matlab中使用CoolProp

在Matlab中使用CoolProp 简介 CoolProp是一个开源的热力学性质库,可以计算多种流体的热力学性质。CoolProp支持多种编程语言,包括Python、C、Matlab等。本文将介绍如何在Matlab中使用CoolProp。 CoolProp官网 本文所使用的Matlab版本为R2021a。 在Ma…

飞天使-k8s知识点26-kubernetes温故知新1-pod

文章目录 创建一个podpod的启动命令和参数更改pod 镜像拉取策略 pod 的三种探针pod 探针的实现方式prestop 和 prestart 创建一个pod apiVersion: v1 # 必选,API 的版本号 kind: Pod # 必选,类型 Pod metadata: # 必选,元数据name: nginx # …

在idea中配置tomcat服务器,部署一个项目(下载教程加链接)

第一步:把Tomcat下载好 ww​​​​​​​Apache Tomcat - Welcome! 链接如上:进去后在左边找到Tomcat8点击进去后 找到图下内容 第二步: 打开这个文件点击bin进去 会出现一个黑色框框,也就是服务器 完成后就可以在浏览器输入…

【爬虫】实战-爬取Boss直聘信息数据

专栏文章索引:爬虫 所用工具: 自动化工具:DrissionPage 目录 一、找到目标数据(2个确定)​ 1.确定目标网页 2.确定目标网址 二、编写代码​ 三、查看数据​ 五、总结 一、找到目标数据(2个确定) 1.确定目标网页 打开目标网站 网站&am…

docker小白第十四天之Portainer与CIG

Portainer简介 Portainer是一款轻量级的应用,它提供了图形化界面,用于方便地管理Docker环境,包括单机环境和集群环境。 Portainer命令安装 # 一个容器可以同时起多个-p端口,restartalways表示随时在线,重启机器后也…

Go语言之函数、方法、接口

一、函数 函数的基本语法: func 函数名(形参列表)(返回值列表) {执行语句...return 返回值列表 } 1.形参列表:表示函数的输入 2.函数中的语句:表示为了实现某一功能的代码块 3.函数可以有返回…

数据在内存中的存储(C语言)(难点,需多刷几遍)

目录 整数在内存中的存储 大小端字节序和字节序判断 什么是大小端? 为什么有大小端? 练习1 练习2 练习3 练习4 练习5 练习6(较难、重点) 代码解读: 浮点数在内存中的存储 练习 浮点数的存储 浮点数存的…

Nginx发布之后可以使用IP访问,不能使用localhost访问, Nginx发布之后可以使用localhost访问,不能使用IP访问,

如标题所说 Nginx发布之后可以使用IP访问,不能使用localhost访问, Nginx发布之后可以使用localhost访问,不能使用IP访问, 修改配置文件也没有用 清除浏览器缓存数据

Python内置对象

Python是一种强大的、动态类型的高级编程语言,其内置对象是构成程序的基础元素。Python的内置对象包括数字、字符串、列表、元组、字典、集合、布尔值和None等,每种对象都有特定的类型和用途。 01 什么是内置对象 这些对象是编程语言的基础构建块&…

万用表革新升级,WT588F02BP-14S语音芯片助力智能测量新体验v

万能表功能: 万能表是一款集多功能于一体的电子测量工具,能够精准测量电压、电流、电阻等参数,广泛应用于电气、电子、通信等领域。其操作简便、测量准确,是工程师们进行电路调试、故障排查的得力助手,为提升工作效率…

服务器端(Debian 12)配置jupyter与R 语言的融合

融合前: 服务器端Debian 12,域名:www.leyuxy.online 1.安装r-base #apt install r-base 2.进入R并安装IRkernel #R >install.packages(“IRkernel”) 3.通过jupyter notebook的Terminal执行: R >IRkernel::installspec() 报错 解决办…

Java项目基于SpringBoot和Vue的时装购物系统的设计与实现

今天要和大家聊的是一款基于SpringBoot和Vue的时装购物系统。 💕💕作者:李同学 💕💕个人简介:混迹在java圈十年有余,擅长Java、微信小程序、Python、Android等,大家有这一块的问题可…

[Qt学习笔记]Halcon窗口界面上显示文字的字体尺寸、样式修改

1、查看Halcon帮助文档 养成良好的查资料习惯,可以实现事半功倍。 1.1 Halcon12和Halcon20不同版本的帮助有所不同 在Halcon12中,有set_font和set_display_font两个算子,其中set_display_font是本地函数形式,所以最终的实现算子…

【MySQL】知识点 + 1

# (1)查询当前日期、当前时间以及到2022年1月1日还有多少天,然后通过mysql命令执行命令。 select curdate() AS 当前日期,curtime() AS 当前时间,datediff(2022-01-01, curdate()) AS 距离2022年1月1日还有天数;# (2)利…

字符串函数---(1)

字符函数 文章目录 前言1.strlen 的使用和模拟实现2.strcpy 的使用和模拟实现3. strcat 的使用和模拟实现4. strcmp 的使用和模拟实现 前言 上一篇我们学习了字符函数,下来我们学习常见的字符串函数 1.strlen 的使用和模拟实现 size_t strlen(const char *str) 字…

LiveGBS流媒体平台GB/T28181功能-HTTPS 服务支持配置开启什么时候需要开启HTTPS测试SSL证书配置HTTPS测试证书

LiveGBS功能支持HTTPS 服务支持配置开启什么时候需要开启HTTPS测试SSL证书配置HTTPS测试证书 1、配置开启HTTPS1.1、准备https证书1.1.1、选择Nginx类型证书下载 1.2、配置 LiveCMS 开启 HTTPS1.2.1 web页面配置1.2.2 配置文件配置 2、HTTPS测试证书3、验证HTTPS服务4、为什么要…

算法---二分查找练习-3(山脉数组的顶峰索引)

山脉数组的顶峰索引 1. 题目解析2. 讲解算法原理3. 编写代码 1. 题目解析 题目地址&#xff1a;点这里 2. 讲解算法原理 初始化两个指针 left 和 right&#xff0c;分别指向数组的起始位置和结束位置。 进入循环&#xff0c;循环条件为 left < right。 在每次循环中&…

每日五道java面试题之mybatis篇(五)

目录&#xff1a; 第一题. 实体类属性名和表中字段名不⼀样 &#xff0c;怎么办?第二题. Mybatis是否可以映射Enum枚举类&#xff1f;第三题. Mybatis能执⾏⼀对⼀、⼀对多的关联查询吗&#xff1f;第四题. Mybatis是否⽀持延迟加载&#xff1f;原理&#xff1f;第五题. 如何获…

HTML_CSS学习:超链接、列表、表格、表格常用属性

一、超链接_唤起指定应用 1.相关代码 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><title>超链接_唤起指定应用</title> </head> <body><a href"tel:10010">电话联…

记录C++中,子类同名属性并不能完全覆盖父类属性的问题

问题代码&#xff1a; 首先看一段代码&#xff1a;很简单&#xff0c;就是BBB继承自AAA&#xff0c;然后BBB重写定义了同名属性&#xff0c;然后调用父类AAA的打印函数&#xff1a; #include <iostream> using namespace std;class AAA { public:AAA() {}~AAA() {}void …
最新文章