【笔记内容部分汇总】
Python基础(16);Pandas数据处理分析(12);时空数据处理分析(14);Python可视化(10);科研门外汉(9)
Python基础(16);Pandas数据处理分析(12);时空数据处理分析(14);Python可视化(10);科研门外汉(9)
【持续扩充】由于经常使用Matplotlib绘制==草图==,发现需要时常去找一些之前的代码,因此便将常用代码和有人整理的一个很nice的速查备忘录贴于此处便于查看。
在处理和分析大量大型的csv文件时(尤其是Geopandas)会遇到读写速度过慢的问题,因此一直想补充一个关于表格型文件读写步骤优化的讨论,此处对主要的结果进行了整理。
一晃已经接近年底,马上到了快要年终总结的时候……
此处记录在本地Windows10/11环境中安装ubuntu环境及Python conda环境安装的过程,可便于后续私有云服务器Python包环境的离线迁移及部署。
学习task02,关于模型的建立和训练,免模型预测和控制,预测此处指学习环境的状态转移矩阵,控制则是得到并改进策略并输出最佳结果。
近期计划开始上手一些深度学习相关的内容,刚好看到DataWhale发布的友好的“小白”组队学习计划,便跟随教材任务学习并定期记录学习过程,首先是第一部分,包含基本概念、马尔可夫过程和动态规划三部分的内容学习。
在绘图时有时需要将本地的表格转换为目标接口要求的格式 -> reshape。以seaborn绘制多变量箱线图为例,其默认数据接口需要的是一列数值加一列类型,但是本地通常是多列,因此需要转换,此外如果涉及到排序也需要自行调整,以下为案例代码记录以供复用:
近期准备把旧电脑给弟用,游戏本,之前装的ubuntu系统,现在重装回windows10,现在装系统之类的事情都十分便捷,此处简单记录一下步骤
初始R语言ggplot2绘图包,了解其绘图逻辑
上一次用R语言已经是去年的事情了,最近想用R进行制图(在涉及统计和统计图表方面还得是R),R的图表和配色也都很好看,便开始再来学一学R。
空间自相关强度计算、热点分析与异常值分析是空间分析中的常用工具,在此简单辨析一下空间自相关等相关工具的差异和用法。主要对比的是全局和局部的==Moran‘s I==以及==Getis-Ord General G==。
在进行指标计算时,尤其是格网数据的数值汇总,经常需要统计汇总面内(区域/研究单元)的点的个数、道路的长度、面的面积,对于点数的统计可以直接spatial join或者count,后者则需要多几步操作。
这几天在处理格网内点统计(面上的点),缓冲区内统计等,会遇到特别慢的情况,这时候对点图层添加==空间索引==(几秒完成)之后,再进行处理,从几十分钟的操作降至十几秒。
这是一个之前就想写一写的话题,昨晚奥特曼发布了GPT-4,继而又引发了一大波转发。其实,从它最开始到现在,我只在测试的时候用过,所以并未在我个人的工作中体会到它的声势所应有的价值,但我对于它是持一个积极的态度,或者说我对GPT模型的应用有一些==期待==。
计算机系统的外部存储器有内置的硬盘、移动硬盘和U盘等,经常会注意到不同的硬盘文件类型不一样,做一些简单了解。以及,为什么有时候数据的实际大小和占据的内存不一致?
2023-03-17,从1月29返京,到2月3组会+元宵节和老师一起庆祝开工,再到2月9日北京下雪,再到2月16号开学注册,再到今天的组会+课题组聚餐,一个多月的时间过得匆忙但也丰富,当然,也得益于似乎远去的疫情。