deepmath-exo7/pythontf2/python/tf2_texte_data.py at master · exo7math/deepmath-exo7

49 lines (37 loc) · 1.72 KB

# Inspired from :
# https://www.kaggle.com/drscarlat/imdb-sentiment-analysis-keras-and-tensorflow
# https://raw.githubusercontent.com/keras-team/keras/master/examples/imdb_lstm.py
import numpy as np
from tensorflow import keras
from tensorflow.keras import optimizers
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Dense
# Partie A. Données
from tensorflow.keras.datasets import imdb
nb_mots_total = 1000   # On ne garde que les n=1000 mots les plus fréquents 
nb_mots_texte = 50     # Pour chaque critique on ne garde que 50 mots 
(X_train_data, Y_train), (X_test_data, Y_test) = imdb.load_data(num_words=nb_mots_total)
# (X_train_data, Y_train), (X_test_data, Y_test) = imdb.load_data()
# Partie A bis. Afficher un texte
# Afficher une critique et sa note 
def affiche_texte(num):
    index_mots = imdb.get_word_index()
    index_mots_inverse = dict([(value, key) for (key, value) in index_mots.items()])
    critique_mots = ' '.join([index_mots_inverse.get(i - 3, '??') for i in X_train_data[num]])
    print("Critique :\n", critique_mots)
    print("Note 0 (négatif) ou 1 (positif) ? :", Y_train[num])
    print("Critique (sous forme brute) :\n", X_train_data[num])
affiche_texte(123)   # affichage de la critique numéro 123
# Partie A ter. Données sous forme de vecteurs
def vectorisation_critiques(X_data):
    vecteurs = np.zeros((len(X_data), nb_mots_total))
    for i in range(len(X_data)):
        for c in X_data[i]:
            if c == 0:
                print("c=999")
            vecteurs[i,c] = 1.0
    return vecteurs
X_train = vectorisation_critiques(X_train_data)
X_test = vectorisation_critiques(X_test_data)
print("Critique 123 sous forme d'un vecteur :", X_train[123])

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

tf2_texte_data.py

Latest commit

History

tf2_texte_data.py

File metadata and controls