一 获取文本的TF-IDF特征 1. 文本向量化特征的不足 在将文本分词并向量化后,我们可以得到词汇表中每个词在各个文本中形成的词向量,比如在文本挖掘预处理之向量化与Hash Trick这篇文章中,…
分类:算法
程序员面试算法之删除链表的倒数第N个节点
给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。 示例: 给定一个链表: 1->2->3->4->5, 和 n = 2. 当删除了倒数第二个节点后,链表变为 …
zhang快速并行细化算法
相关介绍 http://www.doc88.com/p-7724593025971.html 比较好的介绍 https://www.cnblogs.com/xianglan/archive/201…
快速排序-QuickSort
自己尝试着实现的QuickSort,并且每次的关键点不是数组的最后一个元素,而是用随机数得出随机的下标,然后把下标对应的元素当成关键点。还是那句 话,本人菜鸟,请多多指教~~~^^ //交换两个数 template<…
插入排序 - Java
/** * 插入排序 */ public class InsertSort { public static void main(String[] args) { int[] arr = {2, 0, 4, 9, 1, 7…
给定一个字符串,找到包含该字符串所有字符的最短子串
转自:https://blog.csdn.net/jiewuyou/article/details/45061971 这题是豌豆荚二面的一个算法题,和leetcode的某些题目类似。其思路是这样的 首先遍历一次字符串,求…
面试题9:用两个栈实现队列
题目:用两个栈来实现一个队列,完成队列的Push和Pop操作。 class Solution: def __init__(self): self.stackA = [] self.stackB = [] # 进栈,放入栈…
梯度提升树(GBDT)学习笔记
经常参加机器学习相关竞赛的同学肯定对 GBDT 算法并不陌生。GBDT 全称为梯度提升决策树,是传统机器学习算法中对真实分布拟合最好的算法之一,是工业界和竞赛屡试不爽的杀器之一。然而,网上关于 GBDT 算法的介绍却千篇…
Find All Numbers Disappeared in an Array
Given an array of integers where 1 ≤ a[i] ≤ n (n = size of array), some elements appear twice and others appea…
C++ stl队列queue用法介绍
转自:http://www.169it.com/article/2718050585107790752.html C++队列queue模板类的定义在头文件中,queue 模板类需要两个模板参数,一个是元素类型,一个容器类…
最大子数组和
#include <iostream> using namespace std; int Find_Max_Crossing_SubAr(int A[], int low, int mid, int high…
prim 算法笔记 最小生成树
import java.util.Scanner; public class Main { public static void main(String[] args)throws Exception { Scanner…