2021年度最佳开源软件盘点

捷达

共 4688字,需浏览 10分钟

 · 2022-03-04

虽然年度盘点会迟到,但不会缺席。2021年底最佳开源软件,你用过哪些,跟着小千来看。


Svelte

https://svelte.dev/3ade8dd67aa7869eb29dc17fd408a6f9.webpSvelte是一种全新的构建用户界面的方法。传统框架如React和Vue在浏览器中需要做大量的工作,而Svelte将这些工作放到构建应用程序的编译阶段来处理。
与使用虚拟(virtual)DOM差异对比不同。Svelte编写的代码在应用程序的状态更改时就能像做外科手术一样更新DOM。

Minikube

https://minikube.sigs.k8s.io/

adaf6de8fe938b60ecd8010d26f268db.webp


Minikube 可以在本地单机上运行Kubernetes集群的工具。Minikube可跨平台工作,不需要虚拟机,不需要在MacOS或Windows上安装Linux。支持多种容器,如Docker,CRI-O,Containerd等。

Pixie

https://px.dev773f3cd1288fd305736accd7bf6480af.webp
Pixie是查看Kubernetes的工具。可查看Kubernetes集群的状态,比如,服务器集群性能,网络状况,集群资源已经相关应用程序等。还可以查看更详细的内容,比如,pod状态,请求量,热点图等。Pixie的资源占用仅有5%左右。

FastAPI

https://fastapi.tiangolo.com/9ddde37088246ae5f2da76b3af652146.webp
FastAPI是一个Python网页框架。FastAPI以其高效、易用赢得了开发者的青睐,直接挑战了Django和Flash的传统地位。FastAPI的优点是,类型检查、自动 swagger UI、支持异步、强大的依赖注入。

Crystal

https://crystal-lang.org/55afca45a7d349a5869a7a9bd8d6bf61.webp
Crystal已经面试很多年了,Crystal的特点是兼具C语言的高效和Ruby的静态类型。今年初已经发布了1.0版本,目前最新版本为1.2.1,已经足够稳定。

Microsoft Terminal

https://github.com/Microsoft/Terminal5ed87d5264f49c182a957f73585960bb.webp
Microsoft Terminal是一个开源的Windows的终端,提供类似Mac和Linux命令行的体验。Microsoft Terminal具有GPU加速渲染,较传统控制台具有更好的性能提升。

OBS Studio

https://obsproject.com/a2152668c6bfe84167acbd8e981975ec.webp
OBS Studio 是一款用于直播和屏幕录制的软件,为高效捕获,合成,编码,记录和流传输视频内容而设计,支持所有流媒体平台。快捷键可让试图平滑切换,甚至还有画中画和实时字幕的新功能。

Shotcut

https://shotcut.org/1a0652833df706d50eadbe5e9bca44ad.webp
Shotcut是一个强大的视频编辑工具。Shotcut具有中文版支持,可在Windows,MacOS,Linux,BSD等操作系统上运行,Shotcut具有数百种音频、视频格式,以及编解码器,且无需导入,可直接编辑。

Weave GitOps

https://github.com/weaveworks/weave-gitops962307f2a4286cd282616797836c985d.webp
Weave GitOps是一个GitOps工具。其目的是简化DevOps的工作流程,通过声明配置使Kubernetes更加稳定和安全。Weave GitOps基于云原生基金会的 Flux。

Apache Solr

https://solr.apache.org/a3661bc105ffdfcb93d5f40c7cdd76d9.webp
Apache Solr是基于Lucene的全文搜索服务器,也是最流行的企业级搜索引擎。Solr放弃了开源的许可证,不过现在仍然是免费的。Solr可集群部署、可在云端部署,甚至包括LTR算法,可自动调整加权结果。

MLflow

https://mlflow.org/314b4ae752162484c228e8685beedff1.webp
MLflow是由Apache Spark技术团队开源的一个机器学习平台。MLflow由 Databricks 创建,并由Linux基金会托管,是一个MLOps平台,可让用户跟踪、管理和维护各种机器学习模型、实验及其部署。MLflow提供了记录和查询实验(代码、数据、配置、结果)的工具,将数据科学代码打包成项目,并将这些项目接入工作流程。

Orange

https://orangedatamining.com/0dd4c42ca5149999e5441a4d1f436bfc.webp
Orange是一款用于开源机器学习和数据可视化的工具。Orange与R Studio和 Jupyter等程序化或文本工具相比,Orange更直观易操作。Orange包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

Flutter

https://flutter.dev/8f9e250040d9cd2019e13e655fd0f0f6.webp
Flutter是谷歌推出的一个新用于构建跨平台的手机、网页、桌面,嵌入式设备应用的SDK。Flutter的组件,比如,滚动条、导航、图标和字体,整合了IOS和安卓平台的差异。

Apache Superset

https://github.com/apache/superset177334b6ff250315c36e23a096ed263a.webp
Apache Superset是一个现代的、轻量级可视化BI分析工具。Apache Superset在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。而且Apache Superset 已经达到企业级商业软件的水平。

Presto

https://prestodb.io/02b00accecee753f1b2f8b17a3593154.webp
Presto是一个开源的分布式 SQL引擎,用于集群中的在线分析处理。Presto可以查询各种各样的数据源,从文件到数据库,并将结果输出到BI和分析环境。更重要的是,Presto可以在Hive、Cassandra、关系型数据库中进行查询,而且Presto还可以结合多个来源的数据查询。
脸书、Uber、推特和阿里巴巴创立了Presto基金会。其他成员现在包括 Alluxio、Ahana、Upsolver和英特尔。

Apache Arrow

https://arrow.apache.org/b3e21a7ae6d39f6432880c3b1c5dd81a.webp
Apache Arrow是一个列式内存分析层,旨在为CPU和GPU上加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,Arrow内存格式支持零拷贝读取,并且不必序列化的情况下访问数据极快。目前Apache Arrow支持的语言包括C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby和Rust。

InterpretML

https://interpret.ml/2b31fead8478ea53dfdaeafcd531c5f4.webp
InterpretML是微软推出的可解释机器学习包。其中包含了几个最先进的机器学习可解释性技术。InterpretML提供了两类解释性类型:明箱(glassbox) 模型和黑箱(blackbox)模型。InterpretML 可让实践者通过在一个统一的 API 下,借助内置的可扩展可视化平台,使用多种方法来轻松地比较可解释性算法。InterpretML 也包含了可解释 Boosting 机(EBM)的首个实现,这是一种强大的可解释明箱模型,可以做到与许多黑箱模型同等准确。

Lime

https://github.com/marcotcr/limeef1dc4ca4c3c7d2f724e49d4c99a856e.webp
Lime(Local interpretable model-agnostic explanations 局部可解释模型-不可知解释的缩写),Lime用于表格或图片的解释机器学习的分类器。Lime能够解释两个或更多类的黑盒分类器。分类器实现了一个函数,该函数接收原始文本或numpy数组并输出每个类的概率。

Dask

https://dask.org/10c647bb01ac4658c34699cf3017b76e.webp
Dask是一个用于并行计算的开源库,可将Python包扩展到多台机器上。Dask 可将数据和计算分布在多个GPU上,即可在单一系统也可在多节点集群中运行。Dask可与Rapids cuDF、XGBoost和Rapids cuML集成,用于GPU加速的数据分析和机器学习。Dask还可与 NumPy、Pandas和Scikit-learn集成进行并行化工作。

BlazingSQL

https://blazingsql.com/614136c3d790cc7669689e826a30e90d.webp
BlazingSQL是一个基于Rapids生态系统构建的GPU加速SQL引擎。BlazingSQL基于Apache 2.0许可证开源。BlazingSQL是cuDF的SQL接口,具有支持大规模数据科学工作流(包括提取,转换,加载)和企业数据集的各种功能。

Rapids

https://rapids.ai/c0dfdc84aea49cd3fdf527f51178a1c0.webp
Nvidia的Rapids是由英伟达开源的一款开源机器学习GPU加速平台。Rapids使用英伟达CUDA基元进行底层计算优化,通过Python将GPU的并行和高带宽内存以接口方式向外开放。Rapids依赖于Apache Arrow柱状内存格式,包括cuDF(类似Pandas的DataFrame库);cuML(机器学习库集合,提供 Scikit-learn 中大多数算法的GPU版本);以及cuGraph(类似 NetworkX 的加速图分析库)。

PostHog

https://posthog.com/8975e0bf1647e452eaf461ca231d3b75.webp
PostHog是一个为开发者构建的开源产品分析平台。自动收集网站或应用程序上的每个事件,无需向第三方发送数据。PostHog提供基于用户事件的分析,捕获网站的使用数据,统计各用户在网站中的具体操作。PostHog会自动捕获点击次数和综合浏览量,以分析网站用户在做什么,而无需手动推送事件。

Meltano

https://meltano.com/5d43dba987f7777e4a2e4b9dde5d7640.webp
Meltano始于2018年GitLab的内部项目,服务于GitLab数据管理。2021年从GitLab独立出来成为一个初创公司。
Meltano是一款免费DataOps时代的ETL工具,旨在替代替代传统ELT的工具,ELT是指数据提取、加载、转换操作的统称。
Meltano特点是开源、自托管、CLI(命令行)、可调试和可扩展。
Meltano创建管道即代码的概念,Meltano项目可进行版本控制、代码审查、持续集成和部署 (CI/CD )以及容器化等。

Trino

https://trino.io/e9901ec6c82e3d738daa829a98321127.webpTrino用于大数据分析的快速分布式SQL查询引擎。
2019年PrestoDB的开发者创建了一个名为PrestoSQL项目分支。由于所属基金会的转移,PrestoSQL于2020年12月更名为 Trino。
Trino是一款用于大数据分析且性能优越的分布式SQL分析引擎。Trino可同时对EB 级数据湖和海量数据仓库进行高效查询。Trino符合ANSI SQL的查询标准,可与R、Tableau、Power BI、Superset等BI工具配合使用。可在Hadoop、S3、Cassandra、MySQL的数据仓库中联合查询。

StreamNative

https://streamnative.io/522e055cbf8a9df8bbe6105506e8a53f.webp
StreamNative是一款弹性部署且可扩展的消息和事件流平台,大大简化了实时报告和分析工具以及企业应用流的数据管道架设。StreamNative将Apache Pulsar分布式流处理架构与Kubernetes和混合云支持等,以及企业级功能、大型数据、认证和授权、性能监控等工具相结合,既简化了应用程序的开发,又简化了流数据应用的部署和管理。

关注公众号 
获取更多免费资源

浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报