网站首页 互联网 > 正文
假设你正在做一项需要数百万个地理标记的推特的研究。或者也许你是个记者想把2001年到现在芝加哥的谋杀案拍下来。您需要找到大型时空数据集-但在哪里?
虽然有数百个公开的数据集,定位它们可能需要几个月的搜索。当找到潜在的来源时,他们很少提供足够的信息供研究人员决定集合是否实际包含他们需要的那种数据,而不需要下载通常很大的文件并首先对其进行排序。
多亏了加州大学河滨分校(University of California,Riverside)的一位计算机科学家,现在找到正确的数据集就像给一个网站书签一样容易,而且它绝对不值钱。
Marlan和Rosemary Bourns工程学院的计算机科学助理教授Ahmed Eldawy和他的小组在过去三年里对互联网上的公共时空数据集进行了梳理,研究了它们的属性,并在交互式地图上总结了每组数据的结果,这些地图显示了用户的确切信息。
Eldawy说:“从事数据科学工作的人需要数据集,但可以花很多时间去寻找它们。”“我想建立一个他们能轻易找到的档案。”.
称为UCR时空活动存储库,或UCRSTA R,存档可作为一项服务提供给研究社区,以通过交互式探索接口提供对大型时空数据集的方便访问。用户可以搜索和过滤这些数据集,就像为他们的研究而购物一样,除了一切都是免费的。
埃尔达维说:“地图界面将数据可视化,这样你就可以看到它是否很适合。“这就像是数据集的目录。”
在UC R星的核心,地图为数据集提供了一个交互式的探索性接口。类似于谷歌地图或其他网络地图,用户可以放大、缩小和浏览,以快速了解数据的分布、覆盖范围和准确性。
一旦选择数据集,将显示重要的详细信息,如原始主页、原始下载源的链接、以字节为单位的大小、记录数量、文件格式和其他有用信息。子集下载功能允许用户在给定的地理区域内快速下载数据,减少了下载规模..他们还可以在网页上嵌入他们的定制视图,或者通过社交媒体共享链接,并将其书签,以便稍后重新访问。
UCR STAR包含102个数据集和50亿条记录。数据集是使用达芬奇映射的,达芬奇是一个开源框架,它建立在Apache Spark的基础上,Eldawy设计用于处理空间数据。UCRSTA R网站最好通过桌面浏览器访问,但也有一个有限的移动友好界面。
版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
猜你喜欢:
- 2021-09-10 数字技术有能力改变医疗保健
- 2022-08-11 三星本月在其Galaxy Unpacked 2020活动中推出了旗舰智能手机
- 2022-08-07 Vivo下个月将推出一款名为Vivo G1的新手机
- 2022-07-08 为什么IE浏览器经常未响应
- 2022-08-24 蚂蚁庄园小鸡问题:“王婆卖瓜,自卖自夸”这一典故中的王婆其实是
- 2021-10-08 一种控制石墨烯路径中电子颜色的装置
- 2021-06-16 科技资讯:罗技推出价格实惠的Xbox自适应控制器按钮套件
- 2022-07-14 Win10电脑出现运行时间错误怎么处理
最新文章:
- 2023-03-08 常家庄园门票团购(常家庄园门票)
- 2023-03-08 杨凌农博会什么时间开(杨凌农博会)
- 2023-03-08 in the oceans deep
- 2023-03-08 你认为呢用英语怎么说(你呢用英语怎么说)
- 2023-03-08 晕皱是什么意思拼音(晕皱是什么意思)
- 2023-03-08 d color钻石(d c)
- 2023-03-08 暇步士狗头鞋(暇步士狗)
- 2023-03-08 桂鱼清蒸怎么做最好吃视频(桂鱼清蒸怎么做最好吃)
- 热点推荐
- 热评文章
- 随机文章
-
- 某些Stadia Founders Edition的预订已被暂停并取消
- 安卓12 beta 2功能让画中画有了流畅的体验
- Sid Meier的文明VI现已在Xbox One和PlayStation 4上推出
- Sprint现为新老订阅用户提供6个月免费潮汐HiFi
- 小米社区发布MIUI开发版内测更新公告
- 科技资讯:华为的P20和P20 Pro提供独特的徕卡三摄系统
- 科技资讯:新华联资本获主席兼执董傅军增持270.2万股
- 科技要闻:Apple可能会很快发布新的iPad Pro机型,监管备案提示
- 小米可能会在12月10日推出Poco F2 Mi MIX 4或Redmi K30
- 找出所有的围场大惊小怪是179.40美元