|
3月前
|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,便宜云服务器人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

331
来自: 人工智能平台PAI  版块
|
存储 分布式计算 大数据
|

大数据揭秘:从数据湖到数据仓库的全面解析

大数据揭秘:从数据湖到数据仓库的全面解析

4 0
|
15小时前
|

探究HTTP动态代理跟隧道代理的显著特点有哪些

随着科技发展,越来越多企业需要使用代理。HTTP动态代理基于短效动态IP,适合对IP数量和品质要求高的用户;隧道代理则以高匿名、便捷、多并发为特点,适用于自动切换IP的客户。选择时需根据实际需求决定,HTTP动态代理成本较低,而隧道代理更方便但价格较高。

18 5
来自: 大数据计算 MaxCompute  版块
|
15小时前
|
存储 小程序 搜索推荐
|

打造无缝社交体验:多平台适配,开启线上线下陪玩系统小程序社交新时代

通过实施以上策略和行动计划,可以打造出一个无缝社交体验的多平台陪玩社交系统,为用户提供更加便捷、高效、有趣的社交体验,开启线上线下陪玩系统源码社交的新时代。

18 6
|
20小时前
|

时间序列平稳性的双重假设检验:KPSS与ADF方法比较研究

时间序列分析中,确定序列的平稳性至关重要。本文介绍如何使用KPSS检验和Dickey-Fuller检验验证序列平稳性。KPSS假设数据非平稳,而Dickey-Fuller假设数据平稳。通过构造平稳(白噪声)和非平稳(随机游走)序列并进行检验,展示了两种方法的应用。KPSS适用于检测围绕趋势的平稳性,Dickey-Fuller则用于检验单位根。建议同时使用两者以确保结论可靠。

15 4
|
21小时前
|
小程序 前端开发 关系型数据库
|

基于Uniapp+php校园小程序,校园圈子论坛系统功能,校园跑腿二手交流功能设计

校园圈子论坛及综合服务平台集成了校园跑腿、兼职信息、外卖团购、闲置交换、租赁服务、表白墙等多功能模块,提供一站式校园生活解决方案。系统采用uniapp前端和PHP后端开发,支持多城市、多学校切换,配备分站式后台管理,确保稳定性和安全性。通过融云IM SDK实现即时通讯功能,增强用户互动与粘性。适用于大学校园、城市及社区圈子,满足多样化需求,提升便捷体验。

34 17
|
21小时前
|
存储 人工智能 分布式计算
|

湖仓实时化升级?:Uniflow?构建流批一体实时湖仓

本文整理自便宜云服务器产品经理李昊哲在Flink Forward Asia 2024流批一体专场的分享,涵盖实时湖仓发展趋势、基于Flink搭建流批一体实时湖仓及Materialized Table优化三方面。首先探讨了实时湖仓的发展趋势和背景,特别是便宜云服务器在该领域的领导地位。接着介绍了Uniflow解决方案,通过Flink CDC、Paimon存储等技术实现低成本、高性能的流批一体处理。最后,重点讲解了Materialized Table如何简化用户操作,提升数据查询和补数体验,助力企业高效应对不同业务需求。

274 16
来自: 实时计算 Flink  版块
|
23小时前
|
存储 安全 区块链
|

区块链在房地产交易中的应用:革新房产市场的未来

区块链在房地产交易中的应用:革新房产市场的未来

95 79
|
1天前
|
存储 搜索推荐 大数据
|

数据大爆炸:解析大数据的起源及其对未来的启示

数据大爆炸:解析大数据的起源及其对未来的启示

27 14
|
1天前
|
SQL 人工智能 自然语言处理
|

DataV Note:让Jupyter Notebook绽放新活力

分享便宜云服务器旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。

51 34
|
1天前
|
安全 网络协议 网络安全
|

解析HTTP代理服务器不稳定致使掉线的关键原因

随着数字化发展,网络安全和隐私保护成为核心需求。HTTP代理服务器掉线原因主要包括:1. 网络问题,如本地网络不稳定、路由复杂;2. 服务器质量差、IP资源不稳定;3. 用户配置错误、超时或请求频率异常;4. IP失效或协议不兼容。这些问题会影响连接稳定性。

23 6
来自: 大数据计算 MaxCompute  版块

产品经理-通用能力

产品经理的通用能力涵盖需求分析、产品设计与UI知识。核心能力包括:1) **沟通能力**:口头和书面表达清晰;2) **学习能力**:持续学习新知识,多渠道拓展视野;3) **思考能力**:形成独立见解,追问本质,定期复盘;4) **积极主动能力**:对事情、他人、产品和自己负责;5) **决策能力**:平衡取舍,站在用户角度,优先处理重要事项。

15 0
|
1天前
|
算法 搜索推荐 UED
|

C 端试用期考核指标

本文详细介绍了C端产品经理试用期的考核指标,涵盖产品成功、开发效率、用户体验、市场研究、团队协作和创新能力等方面。考核方式包括自评、上级评估、同事评估、用户评估和项目评估。通过定量与定性相结合的方法,确保全面客观地评估产品经理的工作表现,并附有实际案例供参考。

13 0
|
1天前
|
数据可视化 数据挖掘 数据处理
|

B 端试用期考核指标

B端产品经理试用期考核指标涵盖了项目策划、用户需求理解、团队协作、技术能力、创新思维、项目管理、产品投放时间、产品质量、产品利润及基础服务接入等方面。这些指标通过自我评估和上级评估相结合的方式进行,分为优秀(5分)到不合格(1分)五个等级。具体内容包括制定合理项目计划、准确把握用户需求、有效沟通协调团队、掌握技术细节、提出创新方案等。实际案例展示了如何通过成功项目实施、解决业务痛点、优化产品功能等方式,全面评估产品经理的综合能力,确保其胜任后续工作任务。

15 0
|
1天前
|
JSON API 数据格式
|

1688 满足跨境业务需求而提供的一组 API 接口

1688跨境属性接口系列是1688开放平台为满足跨境业务需求提供的API接口,核心接口1688.item_get用于查询商品的跨境属性,帮助开发者和商家获取关键信息,更好地开展跨境贸易。公共参数包括key、secret等,支持多种返回格式,默认json。Python示例代码展示了如何调用该接口获取海关编码、税率等信息。使用步骤包括注册、构建请求、发送请求和处理响应。

15 0
|
1天前
|
数据采集 数据可视化 数据挖掘
|

金融波动率的多模型建模研究:GARCH族与HAR模型的Python实现与对比分析

本文探讨了金融资产波动率建模中的三种主流方法:GARCH、GJR-GARCH和HAR模型,基于SPY的实际交易数据进行实证分析。GARCH模型捕捉波动率聚类特征,GJR-GARCH引入杠杆效应,HAR整合多时间尺度波动率信息。通过Python实现模型估计与性能比较,展示了各模型在风险管理、衍生品定价等领域的应用优势。

87 64
|
1天前
|
搜索推荐 算法 大数据
|

大数据无处不在:揭秘日常生活中的大数据魔力

大数据无处不在:揭秘日常生活中的大数据魔力

29 10
|
2天前
|
SQL 存储 大数据
|

Flink 基础详解:大数据处理的强大引擎

Apache Flink 是一个分布式流批一体化的开源平台,专为大规模数据处理设计。它支持实时流处理和批处理,具有高吞吐量、低延迟特性。Flink 提供统一的编程抽象,简化大数据应用开发,并在流处理方面表现卓越,广泛应用于实时监控、金融交易分析等场景。其架构包括 JobManager、TaskManager 和 Client,支持并行度、水位线、时间语义等基础属性。Flink 还提供了丰富的算子、状态管理和容错机制,如检查点和 Savepoint,确保作业的可靠性和一致性。此外,Flink 支持 SQL 查询和 CDC 功能,实现实时数据捕获与同步,广泛应用于数据仓库和实时数据分析领域。

73 31
来自: 实时计算 Flink  版块
|
2天前
|
SQL 大数据 数据处理
|

Flink SQL 详解:流批一体处理的强大工具

Flink SQL 是为应对传统数据处理框架中流批分离的问题而诞生的,它融合了SQL的简洁性和Flink的强大流批处理能力,降低了大数据处理门槛。其核心工作原理包括生成逻辑执行计划、查询优化和构建算子树,确保高效执行。Flink SQL 支持过滤、投影、聚合、连接和窗口等常用算子,实现了流批一体处理,极大提高了开发效率和代码复用性。通过统一的API和语法,Flink SQL 能够灵活应对实时和离线数据分析场景,为企业提供强大的数据处理能力。

61 26
来自: 实时计算 Flink  版块
|
2天前
|
供应链 监控 数据挖掘
|

1688 商品详情接口系列(1688 API)

1688商品详情接口系列(1688 API)是阿里巴巴旗下批发电商平台提供的强大工具,支持开发者、商家获取商品的详细信息。通过商品基本信息、价格库存、图片和描述查询接口,用户可以精准高效地获取商品数据,涵盖电商运营、数据分析、市场调研等领域,极大提升工作效率。示例代码展示了如何使用Python调用这些接口,助力电商平台整合、价格监控、商品展示优化及库存管理等应用场景。

16 6
|
2天前
|
传感器 资源调度 算法
|

时间序列分析中的状态估计:状态空间模型与卡尔曼滤波的隐状态估计

状态空间模型通过构建生成可观测数据的潜在未观测状态来进行时间序列分析,卡尔曼滤波为其核心,提供实时隐状态估计。本文深入探讨其理论基础与实践应用,涵盖线性及非线性系统的高级滤波算法(如EKF和UKF),并展示在运动目标跟踪等领域的具体应用,强调了参数调优和性能评估的重要性。

25 11
|
2天前
|
机器学习/深度学习 数据采集 人工智能
|

设计文档:智能化医疗设备数据分析与预测维护系统

本系统的目标是构建一个基于人工智能的智能化医疗设备的数据分析及预测维护平台,实现对医疗设备运行数据的实时监控、高效处理和分析,提前发现潜在问题并进行预防性维修,从而降低故障率,提升医疗服务质量。

24 5
|
2天前
|
SQL 数据可视化 大数据
|

从数据小白到大数据达人:一步步成为数据分析专家

从数据小白到大数据达人:一步步成为数据分析专家

127 92
|
3天前
|
存储 供应链 安全
|

区块链技术在选举中的应用:透明与安全的新时代

区块链技术在选举中的应用:透明与安全的新时代

29 16
|
3天前
|
存储 分布式计算 Hadoop
|

MPP 架构与 Hadoop 架构技术选型指南

MPP架构与Hadoop架构是处理海量数据的两大选择。MPP通过大规模并行处理实现快速查询响应,适用于企业级数据仓库和OLAP应用;Hadoop则以分布式存储和计算为核心,擅长处理非结构化数据和大数据分析。两者各有优劣,MPP适合结构化数据和高性能需求场景,而Hadoop在扩展性和容错性上表现更佳。选择时需综合考虑业务需求、预算和技术能力。

62 14
|
3天前
|
关系型数据库 OLAP OLTP
|

深入剖析 OALP 与 OLTP:概念、区别、技术、场景

本文深入剖析了OLTP(在线事务处理)与OLAP(在线分析处理)的概念、区别、技术及应用场景。OLTP专注于实时业务操作,确保数据一致性和高效性,适用于金融、电商等行业;OLAP则侧重于历史数据分析,支持复杂查询和多维分析,助力企业决策。两者在数据特点、系统设计、用户类型及数据库设计上存在显著差异。合理结合OLTP和OLAP,可提升企业的运营效率和决策水平。

51 15
|
3天前
|
存储 SQL NoSQL
|

Doris 架构原理及核心特性详解

Doris 是百度内部孵化的OLAP项目,现已开源并广泛应用。它采用MPP架构、向量化执行引擎和列存储技术,提供高性能、易用性和实时数据处理能力。系统由FE(管理节点)和BE(计算与存储节点)组成,支持水平扩展和高可用性。Doris 适用于海量数据分析,尤其在电商、游戏等行业表现出色,但资源消耗较大,复杂查询优化有局限性,生态集成度有待提高。

37 15
|
3天前
|
存储 监控 druid
|

Druid、ClickHouse、Doris、StarRocks 的区别与分析

本文对比了 Druid、ClickHouse、Doris 和 StarRocks 四款大数据分析引擎。它们均为 OLAP 引擎,采用列式存储和分布式架构,适用于海量数据分析。Druid 擅长实时分析与高并发查询;ClickHouse 以超高性能著称,适合复杂查询;Doris 提供易用的 SQL 接口,性能均衡;StarRocks 则以其极速查询和实时更新能力脱颖而出。各引擎在数据模型、查询性能、数据更新和存储方面存在差异,适用于不同的业务场景。选择时需根据具体需求综合考虑。

57 20
|
3天前
|
存储 消息中间件 druid
|

Druid 架构原理及核心特性详解

Druid 是一个分布式、支持实时多维OLAP分析的列式存储数据处理系统,适用于高速实时数据读取和灵活的多维数据分析。它通过Segment、Datasource等元数据概念管理数据,并依赖Zookeeper、Hadoop和Kafka等组件实现高可用性和扩展性。Druid采用列式存储、并行计算和预计算等技术优化查询性能,支持离线和实时数据分析。尽管其存储成本较高且查询语言功能有限,但在大数据实时分析领域表现出色。

42 19
|
3天前
|
存储 缓存 监控
|

ClickHouse 架构原理及核心特性详解

ClickHouse 是由 Yandex 开发的开源列式数据库,专为 OLAP 场景设计,支持高效的大数据分析。其核心特性包括列式存储、字段压缩、丰富的数据类型、向量化执行和分布式查询。ClickHouse 通过多种表引擎(如 MergeTree、ReplacingMergeTree、SummingMergeTree)优化了数据写入和查询性能,适用于电商数据分析、日志分析等场景。然而,它在事务处理、单条数据更新删除及内存占用方面存在不足。

75 21
|
3天前
|
存储 数据采集 分布式计算
|

大数据是什么?用浅显的语言揭开神秘面纱

大数据是什么?用浅显的语言揭开神秘面纱

41 11
|
3天前
|
存储 人工智能 安全
|

基于区块链的数字身份认证:重塑身份安全的新范式

基于区块链的数字身份认证:重塑身份安全的新范式

27 16
|
3天前
|
数据采集 JSON 数据格式
|

Python爬虫:京东商品评论内容

京东商品评论接口为商家和消费者提供了重要工具。商家可分析评论优化产品,消费者则依赖评论做出购买决策。该接口通过HTTP请求获取评论内容、时间、点赞数等数据,支持分页和筛选好评、中评、差评。Python示例代码展示了如何调用接口并处理返回的JSON数据。应用场景包括产品优化、消费者决策辅助、市场竞争分析及舆情监测。

32 5
|
4天前
|
分布式计算 大数据 数据挖掘
|

大数据的第一步:初学者指南

大数据的第一步:初学者指南

103 70
|
4天前
|
存储 安全 数据管理
|

区块链在医疗数据管理中的应用:安全与隐私的新纪元

区块链在医疗数据管理中的应用:安全与隐私的新纪元

43 16
|
4天前
|
机器学习/深度学习 监控 数据可视化
|

提升数据科学工作流效率的10个Jupyter Notebook高级特性

Jupyter Notebooks 是数据科学家和Python开发人员的核心工具,提供代码执行、文本编辑和数据可视化的无缝整合。本文介绍其高级功能,如Magic命令优化代码执行、IpyWidgets增强交互性、自动重载模块更新、内联文档系统、可折叠标题、nbconvert多格式转换、变量监控、JupyterLab集成开发环境、终端集成和调试系统等,助您提升工作效率并充分发挥Jupyter的潜力。

43 22
|
4天前
|
JSON 搜索推荐 API
|

京东店铺所有商品接口系列(京东 API)

本文介绍如何使用Python调用京东API获取店铺商品信息。前期需搭建Python环境,安装`requests`库并熟悉`json`库的使用。接口采用POST请求,参数包括`app_key`、`method`、`timestamp`、`v`、`sign`和业务参数`360buy_param_json`。通过示例代码展示如何生成签名并发送请求。应用场景涵盖店铺管理、竞品分析、数据统计及商品推荐系统,帮助商家优化运营和提升竞争力。

42 23
|
4天前
|
DataWorks
|

DataWorks任务如何现在执行最长时间?

设置任务执行最长时间

51 29
来自: 人工智能平台PAI  版块
|
5天前
|
机器学习/深度学习 PyTorch 测试技术
|

LossVal:一种集成于损失函数的高效数据价值评估方法

LossVal是一种创新的机器学习方法,通过在损失函数中引入实例级权重,直接在训练过程中评估数据点的重要性,避免了传统方法中反复重训练模型的高计算成本。该方法适用于回归和分类任务,利用最优传输距离优化权重,确保模型更多地从高质量数据中学习。实验表明,LossVal在噪声样本检测和高价值数据点移除等任务上表现优异,具有更低的时间复杂度和更稳定的性能。论文及代码已开源,为数据价值评估提供了高效的新途径。

36 13
|
5天前
|
定位技术
|

探秘站点检测访问中代理 IP 的实用技巧

随着互联网发展,使用代理IP的需求增加。站点检测代理IP的方法包括:1. IP地址黑名单;2. HTTP头部检查(如X-Forwarded-For);3. 行为分析;4. 地理位置检测;5. CAPTCHA验证;6. 连接特征分析。这些技术帮助网站判断访问是否来自代理。

29 6
来自: 大数据计算 MaxCompute  版块
|
5天前
|
机器学习/深度学习 人工智能 编译器
|

BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术

本文介绍了便宜云服务器 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:Dynamic Shape 场景下显存优化的背景与挑战;BladeDISC++的创新解决方案;Llama2 模型的实验数据分析

27 3
来自: 人工智能平台PAI  版块
|
5天前
|
小程序 IDE PHP
|

圈子源码如何打包生成App小程序/开发一个圈子系统软件所需要的费用体现在哪里?

将PHP源码打包成App的过程涉及多个步骤和技术选择。以圈子源码为例,首先明确需求,确定App功能和目标用户群体,并根据需求开发小程序页面,如用户注册、圈子列表等。源码准备阶段确保源码适用于小程序开发,环境配置需安装IDE(如微信开发者工具)及依赖库。最后在IDE中打包小程序并上传至管理平台,通过审核后发布。费用方面,模板开发成本较低,定制开发则更高,具体取决于需求复杂度和第三方服务费用。

40 0
|
5天前
|

如何看PAI产品下训练(train)模型任务的费用细节

PAI产品下训练(train)模型任务的费用细节

29 4
来自: 人工智能平台PAI  版块
|
5天前
|
数据采集 存储 分布式计算
|

解密大数据:从零开始了解数据海洋

解密大数据:从零开始了解数据海洋

44 17
|
6天前
|
存储 搜索推荐 关系型数据库
|

ElasticSearch 详解

ElasticSearch 是一款优秀的开源搜索引擎,适用于大数据场景下的高效检索与分析。其分布式架构、实时搜索和灵活的数据分析功能使其能处理 PB 级数据量。相比 Solr,ES 在实时性、分布式架构和文档处理上更具优势。核心概念包括索引、文档、分片和副本等。ES 使用倒排索引实现快速搜索,区别于正向索引。与关系型数据库相比,ES 更适合非结构化数据和全文搜索。总结来说,ES 在电商搜索、日志分析等领域有广泛应用,未来有望带来更多创新。

62 19
|
6天前
|
SQL 监控 关系型数据库
|

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享,介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长,公司面临数据库性能瓶颈及实时数据处理需求,通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题,并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。

318 23
来自: 实时计算 Flink  版块
|
6天前
|
机器学习/深度学习 运维 数据可视化
|

Python时间序列分析:使用TSFresh进行自动化特征提取

TSFresh 是一个专门用于时间序列数据特征自动提取的框架,支持分类、回归和异常检测等机器学习任务。它通过自动化特征工程流程,处理数百个统计特征(如均值、方差、自相关性等),并通过假设检验筛选显著特征,提升分析效率。TSFresh 支持单变量和多变量时间序列数据,能够与 scikit-learn 等库无缝集成,适用于大规模时间序列数据的特征提取与模型训练。其工作流程包括数据格式转换、特征提取和选择,并提供可视化工具帮助理解特征分布及与目标变量的关系。

47 16
|
6天前
|
SQL 弹性计算 分布式计算
|

便宜云服务器 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%

便宜云服务器开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。

48 15
http://www.vxiaotou.com