本系列笔记《Python环境》预计包含五块内容:1 基础知识; 2 环境配置; 3 环境及包管理; 4 环境迁移与共享; 5 环境debug。此处记录我认为的关于Python及环境的前置必要知识

今天顺利开完了一月一次的组会,和往常一样到了接近晚饭饭点才结束。汇报的主体~建模部分的工作都是在这一周的时间里完成的,尤其是最后两天,晚上回到宿舍都会和室友不禁感慨组会前几天的效率为什么可以这么高,这么说来人的潜力真的很大啊,是嘛?

看最新的文献(尤其是top)是必要的,尤其是在比较热门的领域。一方面可以学习膜拜借鉴收获灵感,开阔研究思路,同时也能熟悉自己学科或工作相关的当前的国际研究热点/前言理论方法,有助于论文选题,工作开展及撰写。地理方面,国内的文章可以通过期刊官网和一些公众号,英文SCI则主要借助RSS(需要梯子)。关于论文检索和下载可以看之前的论文检索论文下载

ArcGIS是进行空间数据处理分析及制图的常用软件,功能强大。尽管esri截止10.7已停止对其的维护转向ArcGIS Pro,但平时用的还是以ArcGIS为主。在此罗列一下遇到的问题需求及可用的工具箱ArcToolbox模块以供查阅。

空间参考即地理/投影坐标系是地理研究、GIS数据处理及空间分析的基础。好早就学,但直到现在也还是好像懂但又不怎么懂的一个点。在此希望基于资料和自己当前的理解及实践,用尽可能短的篇幅小结一下:(1) 空间参考、地理/投影坐标系相关的概念;(2) 常用坐标系及选择依据;(3) 软件(ArcGIS/QGIS)及代码(Python/R)的坐标系(批)处理方式。

近期在进行统计广义回归建模及不断查阅请教的过程中温习、学习了一些统计相关的概念,也有了更多的理解,准备结合之前上课的笔记和看的一些书籍/博客陆续整理一下基础概念,以加深理解及便于复用。持续更新...

在建模前不论是机器学习还是统计模型(统计模型尤其)首先需要对变量有深入的了解,包括其数值类型、服从的分布等等,并针对不同数据可能的异常值进行不同的预处理,标准化?log变换?剔除?等,快速通过Python/R进行出图探索。

wiki 在计算中,行优先顺序(Row-major order)和列优先顺序(column-major order)是在随机存取存储器 等线性存储器中存储多维数组的方法。顺序之间的区别在于数组的哪些元素在内存中是连续的。在行优先顺序中,行的连续元素彼此相邻。它对遍历数组时的性能也很重要,因为 CPU 处理顺序数据比处理非顺序数据更有效

初步小结一下图形保存本地的常用设置(可用于论文出图),通过参数设置可以输出非常高质量清晰的且长宽格式的图片或pdf文件,主要介绍png、svg及pdf格式,以A4纸的宽度21cm或一半10cm为例测试。对于具体图形、文字、线条等尺寸的大小控制及文件格式可见上篇

.ipynb是使用jupyter notebook/lab写代码的文件格式,最初只能在jupyter notebook中打开,不便查看,但除vscode,还可以借助一些工具/插件(QuickLook, nteract, )在不打开jupyter的情况下以自带格式方便查看

经常需要批量操作文件夹及文件路径,遂汇总一下Python操作文件夹目(foulder)及文件(file path)的函数以便速查。常用的几个内置模块:osglobshutil,包括:文件路径批量-读取、重命名、删除、复制、移动以及目录的创建、重命名、删除、移动。结合条件判断可以实现各类操作。

爬虫类别笔记主要小结自己数据抓取的一些学习参考和经验,后续也考虑放一些自己数据抓取的案例。第一篇先记录一下自己的学习路径和一点体会。

下载了天尺度1km格网的中国区域的温度数据,nc文件格式,需要先裁剪并输出为tif以便后续的提取工作,在Python里折腾老半天不得劲,最后用R语言完成