2021年度最佳开源软件盘点
捷达
共 4688字,需浏览 10分钟
·
2022-03-04 14:37
虽然年度盘点会迟到,但不会缺席。2021年底最佳开源软件,你用过哪些,跟着小千来看。
Svelte
https://svelte.dev/Svelte是一种全新的构建用户界面的方法。传统框架如React和Vue在浏览器中需要做大量的工作,而Svelte将这些工作放到构建应用程序的编译阶段来处理。与使用虚拟(virtual)DOM差异对比不同。Svelte编写的代码在应用程序的状态更改时就能像做外科手术一样更新DOM。
Minikube
https://minikube.sigs.k8s.io/Minikube 可以在本地单机上运行Kubernetes集群的工具。Minikube可跨平台工作,不需要虚拟机,不需要在MacOS或Windows上安装Linux。支持多种容器,如Docker,CRI-O,Containerd等。
Pixie
https://px.devPixie是查看Kubernetes的工具。可查看Kubernetes集群的状态,比如,服务器集群性能,网络状况,集群资源已经相关应用程序等。还可以查看更详细的内容,比如,pod状态,请求量,热点图等。Pixie的资源占用仅有5%左右。
FastAPI
https://fastapi.tiangolo.com/FastAPI是一个Python网页框架。FastAPI以其高效、易用赢得了开发者的青睐,直接挑战了Django和Flash的传统地位。FastAPI的优点是,类型检查、自动 swagger UI、支持异步、强大的依赖注入。
Crystal
https://crystal-lang.org/Crystal已经面试很多年了,Crystal的特点是兼具C语言的高效和Ruby的静态类型。今年初已经发布了1.0版本,目前最新版本为1.2.1,已经足够稳定。
Microsoft Terminal
https://github.com/Microsoft/TerminalMicrosoft Terminal是一个开源的Windows的终端,提供类似Mac和Linux命令行的体验。Microsoft Terminal具有GPU加速渲染,较传统控制台具有更好的性能提升。
OBS Studio
https://obsproject.com/OBS Studio 是一款用于直播和屏幕录制的软件,为高效捕获,合成,编码,记录和流传输视频内容而设计,支持所有流媒体平台。快捷键可让试图平滑切换,甚至还有画中画和实时字幕的新功能。
Shotcut
https://shotcut.org/Shotcut是一个强大的视频编辑工具。Shotcut具有中文版支持,可在Windows,MacOS,Linux,BSD等操作系统上运行,Shotcut具有数百种音频、视频格式,以及编解码器,且无需导入,可直接编辑。
Weave GitOps
https://github.com/weaveworks/weave-gitopsWeave GitOps是一个GitOps工具。其目的是简化DevOps的工作流程,通过声明配置使Kubernetes更加稳定和安全。Weave GitOps基于云原生基金会的 Flux。
Apache Solr
https://solr.apache.org/Apache Solr是基于Lucene的全文搜索服务器,也是最流行的企业级搜索引擎。Solr放弃了开源的许可证,不过现在仍然是免费的。Solr可集群部署、可在云端部署,甚至包括LTR算法,可自动调整加权结果。
MLflow
https://mlflow.org/MLflow是由Apache Spark技术团队开源的一个机器学习平台。MLflow由 Databricks 创建,并由Linux基金会托管,是一个MLOps平台,可让用户跟踪、管理和维护各种机器学习模型、实验及其部署。MLflow提供了记录和查询实验(代码、数据、配置、结果)的工具,将数据科学代码打包成项目,并将这些项目接入工作流程。
Orange
https://orangedatamining.com/Orange是一款用于开源机器学习和数据可视化的工具。Orange与R Studio和 Jupyter等程序化或文本工具相比,Orange更直观易操作。Orange包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。
Flutter
https://flutter.dev/Flutter是谷歌推出的一个新用于构建跨平台的手机、网页、桌面,嵌入式设备应用的SDK。Flutter的组件,比如,滚动条、导航、图标和字体,整合了IOS和安卓平台的差异。
Apache Superset
https://github.com/apache/supersetApache Superset是一个现代的、轻量级可视化BI分析工具。Apache Superset在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。而且Apache Superset 已经达到企业级商业软件的水平。
Presto
https://prestodb.io/Presto是一个开源的分布式 SQL引擎,用于集群中的在线分析处理。Presto可以查询各种各样的数据源,从文件到数据库,并将结果输出到BI和分析环境。更重要的是,Presto可以在Hive、Cassandra、关系型数据库中进行查询,而且Presto还可以结合多个来源的数据查询。
脸书、Uber、推特和阿里巴巴创立了Presto基金会。其他成员现在包括 Alluxio、Ahana、Upsolver和英特尔。
Apache Arrow
https://arrow.apache.org/Apache Arrow是一个列式内存分析层,旨在为CPU和GPU上加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,Arrow内存格式支持零拷贝读取,并且不必序列化的情况下访问数据极快。目前Apache Arrow支持的语言包括C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby和Rust。
InterpretML
https://interpret.ml/InterpretML是微软推出的可解释机器学习包。其中包含了几个最先进的机器学习可解释性技术。InterpretML提供了两类解释性类型:明箱(glassbox) 模型和黑箱(blackbox)模型。InterpretML 可让实践者通过在一个统一的 API 下,借助内置的可扩展可视化平台,使用多种方法来轻松地比较可解释性算法。InterpretML 也包含了可解释 Boosting 机(EBM)的首个实现,这是一种强大的可解释明箱模型,可以做到与许多黑箱模型同等准确。
Lime
https://github.com/marcotcr/limeLime(Local interpretable model-agnostic explanations 局部可解释模型-不可知解释的缩写),Lime用于表格或图片的解释机器学习的分类器。Lime能够解释两个或更多类的黑盒分类器。分类器实现了一个函数,该函数接收原始文本或numpy数组并输出每个类的概率。
Dask
https://dask.org/Dask是一个用于并行计算的开源库,可将Python包扩展到多台机器上。Dask 可将数据和计算分布在多个GPU上,即可在单一系统也可在多节点集群中运行。Dask可与Rapids cuDF、XGBoost和Rapids cuML集成,用于GPU加速的数据分析和机器学习。Dask还可与 NumPy、Pandas和Scikit-learn集成进行并行化工作。
BlazingSQL
https://blazingsql.com/BlazingSQL是一个基于Rapids生态系统构建的GPU加速SQL引擎。BlazingSQL基于Apache 2.0许可证开源。BlazingSQL是cuDF的SQL接口,具有支持大规模数据科学工作流(包括提取,转换,加载)和企业数据集的各种功能。
Rapids
https://rapids.ai/Nvidia的Rapids是由英伟达开源的一款开源机器学习GPU加速平台。Rapids使用英伟达CUDA基元进行底层计算优化,通过Python将GPU的并行和高带宽内存以接口方式向外开放。Rapids依赖于Apache Arrow柱状内存格式,包括cuDF(类似Pandas的DataFrame库);cuML(机器学习库集合,提供 Scikit-learn 中大多数算法的GPU版本);以及cuGraph(类似 NetworkX 的加速图分析库)。
PostHog
https://posthog.com/PostHog是一个为开发者构建的开源产品分析平台。自动收集网站或应用程序上的每个事件,无需向第三方发送数据。PostHog提供基于用户事件的分析,捕获网站的使用数据,统计各用户在网站中的具体操作。PostHog会自动捕获点击次数和综合浏览量,以分析网站用户在做什么,而无需手动推送事件。
Meltano
https://meltano.com/Meltano始于2018年GitLab的内部项目,服务于GitLab数据管理。2021年从GitLab独立出来成为一个初创公司。
Meltano是一款免费DataOps时代的ETL工具,旨在替代替代传统ELT的工具,ELT是指数据提取、加载、转换操作的统称。
Meltano特点是开源、自托管、CLI(命令行)、可调试和可扩展。
Meltano创建管道即代码的概念,Meltano项目可进行版本控制、代码审查、持续集成和部署 (CI/CD )以及容器化等。
Trino
https://trino.io/Trino用于大数据分析的快速分布式SQL查询引擎。2019年PrestoDB的开发者创建了一个名为PrestoSQL项目分支。由于所属基金会的转移,PrestoSQL于2020年12月更名为 Trino。
Trino是一款用于大数据分析且性能优越的分布式SQL分析引擎。Trino可同时对EB 级数据湖和海量数据仓库进行高效查询。Trino符合ANSI SQL的查询标准,可与R、Tableau、Power BI、Superset等BI工具配合使用。可在Hadoop、S3、Cassandra、MySQL的数据仓库中联合查询。
StreamNative
https://streamnative.io/StreamNative是一款弹性部署且可扩展的消息和事件流平台,大大简化了实时报告和分析工具以及企业应用流的数据管道架设。StreamNative将Apache Pulsar分布式流处理架构与Kubernetes和混合云支持等,以及企业级功能、大型数据、认证和授权、性能监控等工具相结合,既简化了应用程序的开发,又简化了流数据应用的部署和管理。
关注公众号
获取更多免费资源
评论