python – 使用机器学习解码回溯

我试图解决一个问题,我有文件包含解码回溯(堆栈调用跟踪),只要有崩溃(在
Linux世界中),我有一个唯一的ID来跟踪每次发生的崩溃.

我想构建一个类器,它将从之前的解码回溯中学习,并预测是否存在已经存在的当前回溯ID.

这是我的第一个机器学习项目.我使用机器学习并在python中使用CountVectorizer和TF-IDF方法进行了试验.

我想知道要考虑哪些特征用于分类和适当的文本分类算法来解决这个问题.

最佳答案 很高兴听到这是您的第一个机器学习项目!对于我的第一个NLP,我正在使用亚马逊产品进行审核.你试试Bag of words(BOW)模型吗?你也可以尝试N-gram.您可以考虑使用NaiveBayes分类器并评估您的分类.然后你会知道哪个会给你最好的算法来解决问题.

额外阅读(如果你愿意):https://machinelearningmastery.com/encoder-decoder-models-text-summarization-keras/

点赞