43 lines
1.5 KiB
Python
43 lines
1.5 KiB
Python
import pandas as pd
|
|
import os
|
|
from datetime import datetime
|
|
|
|
# Caminhos
|
|
pasta_entrada = r"C:\Users\andressa.rocha\OneDrive - GRUPO GINSENG\2025\Indicadores_Melhoria\Acompanhamento_Indicadores_Sup\RUPTURA\MAR"
|
|
pasta_saida = r"C:\Users\andressa.rocha\OneDrive - GRUPO GINSENG\2025\Indicadores_Melhoria\Acompanhamento_Indicadores_Sup\RUPTURA\RUPTURA_2025"
|
|
|
|
# Lista para armazenar os DataFrames
|
|
dfs = []
|
|
|
|
# Iterar pelos arquivos na pasta
|
|
for nome_arquivo in os.listdir(pasta_entrada):
|
|
if nome_arquivo.endswith(".csv"):
|
|
caminho_arquivo = os.path.join(pasta_entrada, nome_arquivo)
|
|
|
|
# Leitura do CSV
|
|
df = pd.read_csv(caminho_arquivo, sep=None, engine='python') # Detecta separador automaticamente
|
|
|
|
# Obter data de modificação do arquivo
|
|
timestamp = os.path.getmtime(caminho_arquivo)
|
|
data_modificacao = datetime.fromtimestamp(timestamp).strftime('%Y-%m-%d')
|
|
|
|
# Adiciona coluna com data da última atualização
|
|
df["data_ultima_atualizacao"] = data_modificacao
|
|
|
|
# Adiciona à lista
|
|
dfs.append(df)
|
|
|
|
# Unir todos os DataFrames
|
|
df_unificado = pd.concat(dfs, ignore_index=True)
|
|
|
|
# Garantir que a pasta de saída existe
|
|
os.makedirs(pasta_saida, exist_ok=True)
|
|
|
|
# Caminho do arquivo de saída
|
|
arquivo_saida = os.path.join(pasta_saida, "ruptura_unificada_2025.parquet")
|
|
|
|
# Salvar em formato Parquet
|
|
df_unificado.to_parquet(arquivo_saida, index=False)
|
|
|
|
print("Arquivo Parquet gerado com sucesso:", arquivo_saida)
|