Preguntas y respuestas e información sobre pandas

¿Cómo agregar etiquetas al cargar a S3 desde pandas?

Pandas le permite pasar una ruta de AWS S3 directamente a .to_csv() y .to_parquet(). Hay un argumento storage_options para pasar argumentos específicos de S3. Me gustaría llamar a .to_csv('s3://bucket/key.csv',...

• python • pandas • csv • amazon-s3 • tags

Error de atributo: el objeto 'flotante' no tiene atributo 'dividido' cuando se crea una bolsa de palabras a partir del marco de datos de pandas

aquí está mi marco de datos l2_name l2_name 0 Camping 1 Parque temático 2 Playa 3 otros 4 Aeropuerto nacional Esto es lo que intento l2 = [set(x.split()) for x in l2_name['l2_name'].str.lower()] Error ...

¿Cómo eliminar ciertas cadenas de la lista en el marco de datos? pitón muy básico

Quiero eliminar cierta cadena de un formulario de lista en Dataframe. Declaré una lista y quiero eliminar estas 3 palabras en el marco de datos. Cada oración de la lista en el marco de datos está separada como palabra y no...

Problema de Python/pandas KeyError con funciones definidas por el usuario

¿Por qué estas dos funciones funcionan correctamente y se ejecutan sin errores? def avgSalespWpY(df, weekStart_col_name, sku_col_name, order_col_name): df['SKU_WEEK'] = pd.DatetimeIndex(df[weekStart_col_name])....

Creación de una agregación de ventana móvil al incluir solo filas que cumplen la condición

Tengo un marco de datos con algunos eventos, junto con la fecha (si) se tomó una acción, junto con el agente que realizó la acción, como se muestra a continuación: create_date agent action_taken action_date 0 2021-10-...

Filtrar pandas DataFrame por coincidencia de cadena

Me gustaría verificar la coincidencia de subcadenas entre los comentarios y la columna de palabras clave y encontrar si alguna de las palabras clave está presente en esa fila en particular. nombre de entrada comentarios palabras clave 0 ...

variable local 'resultado' referenciada antes de la asignación

Estoy tratando de importar mi calculadora creada con spyder en pandas Jupyter pero recibí el error anterior. Intenté usar else: pero aún obtengo el error. Aquí está mi código spyder. importar pandas como pd def...

¿Cómo probar diferentes condiciones para optimizar un algoritmo comercial?

Para ganar dinero con el comercio algorítmico, necesita condiciones para ingresar y cerrar sus operaciones con una ventaja estadística. Un punto difícil a la hora de buscar la estrategia adecuada para el mercado actual...

Python pandas: ¿puedo ordenar el conjunto de datos de 1 columna en filas de datos coincidentes en otro conjunto de datos?

He escrito la mitad de un código y me quedé atascado en la segunda mitad. Extraje información de un documento de texto y coloqué la información en la columna del conjunto de datos de pandas con datos como Trabajo: una Hora: 17:00 Fecha: Martes Costo:...

¿Cómo filtrar la columna según el rango de valores de otra columna?

Tengo un df como el siguiente, donde y es el objetivo (ya sea 0 o 1). ¿Cómo encuentro qué porcentaje de y es 0 o 1, según un rango de valores de mi x? Ejemplo: Para valores de x entre 0 y 20, el...

¿Cómo imprimo filas específicas que cumplen las condiciones?

Estoy tratando de averiguar, ¿hay alguna forma de imprimir las filas que cumplan con la condición que establecí? Actualmente estoy usando iterrows() aunque sé que no es lo ideal, tengo más de 1000 filas de datos que debo...

El gráfico de barras y el gráfico de líneas se trazan de forma extraña

Tengo una pregunta sobre matplotlib. Las siguientes son las lecturas de mis datos. Mientras configuro mi índice en las marcas de tiempo en el eje x, mientras que las lecturas en el eje y. Trazo como los siguientes gráficos pero el ...

Borrar columna basada en un valor que aparece en otra columna

Siento que esto debería ser realmente simple, pero he estado atascado en esto todo el día. Tengo un marco de datos que se ve así: Nombre Fecha Graduado ¿En serio? Bob 2014 Sí Bob 2020...

Cree un DataFrame con sus valores como índice concatenado y nombres de columna

Me gustaría crear un DataFrame de pandas con sus valores como índice concatenado y nombres de columna. En el siguiente ejemplo, tendría el nombre de la columna concatenado con el nombre de la fila; sin embargo, al revés...

Trazado de parámetros de regresión OLS

Estoy tratando de construir un gráfico de barras usando algunos coeficientes de una regresión OLS. Mi modelo se llama jun07_OLS. Entonces llamé a jun07_OLS.params para obtener: Intercepción 4.580174 jun06 0.616195 ...