Jul 16, 2024
studio.azureml.net
并登录。+New
,然后选择 Blank Experiment
。Samples
下的 Saved Datasets
。Airport Codes
数据集(列表中的第二个)Flight On-time Performance
数据集Airport Codes
与主数据集结合以映射机场ID为有意义的名称和位置。Airport Codes
数据集使用 Edit Metadata
并适当重新命名列以便合并。origin_airport_id
或 dest_airport_id
列执行 join 操作合并数据集。origin_airport_id
、dest_airport_id
、cancelled
和 diverted
。Edit Metadata
隔离分类特征和数字特征。Clean Missing Data
。departure_delay
和 arrival_delay
)应用 Normalize Data
以确保一致的缩放。Split Data
组件将数据分割为 训练集(95%) 和 测试集(5%)。Split Data
将训练数据进一步分为 训练集(81%) 和 验证集(14%)。Two-Class Boosted Decision Tree
进行分类。Tune Model Hyperparameters
模块找到分类算法的最佳配置。Tune Model Hyperparameters
中的 best
模型与 Train Model
连接,并使用训练数据集。Score Model
测试使用验证集和/或测试集训练好的模型。Evaluate Model
获得准确性、F1得分、精准度、召回率等指标。