既然说中国程序员开源的问题,我觉得我有资格来回答一下。我正在尝试开发一个对数据分析师更友好的Python框架。
两年前,我有一个项目需要对大量数据进行频繁的ORM操作和分析。Pandas在数据分析方面是个不错的选项,但对于ORM操作Pandas就有点难受了,同时Pandas的接口设计也不够友好。
为此,我开发了一个对标Pandas的数据分析/操作框架DaPy,并在我的许多个人项目中使用和完善他。今年早些时候我朋友在做code-review的时候看到了在DaPy框架下简洁优雅的代码,就建议我大力推广开源他。
现在这个项目在Github已经获得了197个Star以及pip上半年内总计1000+的安装量。然而,我承认DaPy还不够好:1. 性能确实比不上Numpy为引擎的Pandas,即使我用各种骚操作进行优化,5项不同任务的耗时都还是比Pandas多3-9倍的;2. 由于是个人开发的,导致文档方面更新跟不上,对于尝试该框架的新手而言可能不是很友好。
这么多经历下来,我感觉要开发一款开源框架需要以下几个要素:1. 敢于突破权威的勇气和创新精神;2. 超前的编程范式的认识;3. 强悍的代码功底(我担心DaPy的源码被吐槽,用pylint跑了好多次分的呢 );4. 极强的毅力与耐力(写一个框架真的要好长时间的);5. 足够的资金让你有时间无忧无虑的去写代码
想想现在中国程序员的现状:1. 被大量的业务代码压着,没时间学习和创新;2. 996的工作让自己抽不出很长的时间写代码;3. 经济压力大;4. 普遍对国人开发的东西不自信
Based on the discussions from the last two paragraphs, we can perfectly answer the question.
好啦,我就看看回答完这篇问题,会有多少人去Github帮我点赞。是的,这就是一个求赞的广告贴。如果你想更多的了解DaPy特性,可以参阅:一个全新的Python数据分析框架:DaPy带你领略从未有过的丝滑般数据分析体验 - 掘金