近日,看到-生信作曲家-发的帖子,展示的内容是单细胞差异基因的图,是利用热图的形式展现的,在一个热图上可以展示不同cluster中不同组的基因表达阳性细胞比例,差别一目了然,可以同时展示很多的基因。 首先构建作图数据,我…
分类:数据挖掘
生存分析统计方法选择,可以避免的一些坑
我们首先看看什么是生存分析? 因为无法在短时间内评价慢性病患者的预后,所以通常情况下不会简单地采用治愈率、病死率等指标,而是对患者进行随访,分析一定的时间之后患者生存或死亡的情况,这种将事件的结果和出现这一结果所经历的时…
应用数据挖掘进行客户关系管理
应用数据挖掘进行客户关系管理 在当今市场上,商业的成功离不开有效的客户关系管理(Customer Relationship Management,CRM)。客户关系管理的本质是更有效地进行竞争。客户关系管理的目标是缩减销…
Python办公自动化|批量提取Excel数据
点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 无情最是台城柳,依旧烟笼十里堤。 大家好,又到了Python办公自动化系列。 今天我们来讲解一…
(详细)数据挖掘面试笔试题及答案
一、单选题(共80题) ( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。 A.数据清洗 B…
数据挖掘的概念和步骤
一、数据挖掘概念 数据挖掘是从大量数据中通过数理统计算法搜索隐藏于其中的信息的过程。 数据挖掘是一种决策支持过程…
PCA图 (主成分 biplot & 三维图) 绘制与解释 | python
问题:如何绘制二维和三维的主成分图,以及如何解释? Code: 二维图 import matplotlib.pyplot as plt import numpy as np def biplot(reduced_data…
时间序列数据趋势分析 Cox-Stuart、Mann-Kendall、Dickey-Fuller
时序数据趋势检测 斜率法 Cox-Stuart检验 Mann-Kendall检验 稳定性检验 滚动统计 Dickey-Fuller(迪基-福勒检验、单根检验) 时序数据趋势检测 斜率法 原理: 斜率法的原理就是使用最小二…
python将一列数字转换成n行
# -*- coding: utf-8 -*- """将CSV文件中的一列按自己的意愿转换成n行""" data= pd.read_csv('C:\\Users\\1701\Desktop\\123.csv')#读地址 …
时序数据特征提取
时序数据特征提取 时间序列的表示方法 分段线性表示 分段线性表示 符号化聚合近似 时间序列的相似性度量方法 Minkowski距离 动态时间弯曲 符号化距离 基于模型的距离度量方法 时间序列的特征提取方法 基于统计特征的…
解决Tableau做漏斗图转化率不对的问题
目标:利用Tableau搭建好模板后,可以直接出漏斗图,自动计算每个环节的转化率。比如阶段2,3,4相较于阶段1的转化率,或者是每个阶段对于初始阶段的转化率,理想的效果图如下 问题:但根据数据逻辑,在实际操作中,容易出现…
中文文本关键词抽取的三种方法-python
利用Python实现中文文本关键词抽取的三种方法 转自github 文本关键词抽取,是对文本信息进行高度凝练的一种有效手段,通过3-5个词语准确概括文本的主题,帮助读者快速理解文本信息。目前,用于文本关键词提取的主要方法…