2020年 算法工程师生存怪状
NLP从入门到放弃
共 3597字,需浏览 8分钟
·
2021-02-11 02:50
训练数据是不是有问题?
这个场景是不是不太适合这个模型?
我早就觉得这个模型结构很奇怪!
Tensorflow, 最流行的深度学习框架之一,起源于Google内部,有非常完整的一套工具用于生产环境部署,可能是企业界最受欢迎的深度学习框架。
PyTorch, 最fancy的深度学习框架,fork自日本的Chainer, 使用起来较为方法,语法非常的Pythonic,相对于tensorflow的较为容易上手。
Keras, 深度学习高级接口,不限定后端。其接口设计非常优雅,及其容易上手。
编程语言:
Python, 必备, 有一句流行语「Data scientist should use Python.」
Java/C++/Golang,可选,但是建议掌握。如果你需要部署模型到生产环境,考虑到各个公司的编程语言栈不同,但国内大部分是Java/C++/Golang的其中一种或几种,如果你会其中的一种编程语言,这会对你很有帮助。
SQL, 必备, 很常用,你不能不会。
常用库:
Spark/Flink, 必备, 数据处理与流失计算。
ScikitLearn/Pandas/Numpy:可选,但强烈建议掌握。这是大家都会且经常用到的工具,如果你还不会,建议尽快掌握。且Numpy是很多Python数值计算的基础库,包括Tensorflow等等。
评论