Substring único mais curto


14

Dadas (em STDIN, como argumentos de linha de comando ou argumentos de função) duas seqüências de caracteres não vazias distintas, localize e retorne a menor substring da primeira string que não é uma substring da segunda. Se não existir essa substring, você pode retornar a string vazia, retornar qualquer string que não seja uma substring da string original ou lançar uma exceção. Se você estiver retornando de uma função, também poderá retornar nulo (ou indefinido, Nenhum etc.) nesse caso. Se várias dessas substrings estiverem vinculadas pelo menor tempo, você poderá retornar qualquer uma delas.

As strings podem consistir em qualquer caractere ASCII imprimível.

As entradas fornecidas no STDIN serão fornecidas com uma string em cada linha. A seu pedido, uma única linha vazia pode ser adicionada no final da entrada.

Isso é código de golfe, então o programa válido mais curto vence.

ALGUNS CASOS DE TESTE

ENTRADA:

STRING ONE
STRING TWO

RESULTADO:

E

ENTRADA:

A&&C
A&$C

SAÍDAS VÁLIDAS:

&&
&C

ENTRADA:

(Duas seqüências de 80 letras geradas aleatoriamente)

QIJYXPYWIWESWBRFWUHEERVQFJROYIXNKPKVDDFFZBUNBRZVUEYKLURBJCZJYMINCZNQEYKRADRYSWMH
HAXUDFLYFSLABUCXUWNHPSGQUXMQUIQYRWVIXGNKJGYUTWMLLPRIZDRLFXWKXOBOOEFESKNCUIFHNLFE

TODAS AS SAÍDAS VÁLIDAS:

AD
BJ
BR
CZ
DD
EE
ER
EY
EY
FF
FJ
FW
FZ
HE
IJ
IN
IW
JC
JR
JY
KL
KP
KR
KV
LU
MH
MI
NB
NQ
OY
PK
PY
QE
QF
QI
RA
RB
RF
RO
RV
RY
RZ
SW
UE
UH
UN
UR
VD
VQ
VU
WB
WE
WI
WU
XN
XP
YI
YK
YK
YM
YS
YW
YX
ZB
ZJ
ZN
ZV

1
mais curto ou mais longo?
Leaky Nun

@FryAmTheEggman Então devo ainda postar minha solução ...
Leaky Nun

"Uma string em cada linha" com ou sem aspas?
Leaky Nun

1
Podemos pegar uma variedade de strings?
21416 Dennis

"B" é uma subcadeia de "aBc"?
downrep_nation

Respostas:


4

Braquilog , 23 bytes

:1foh.,{,.[A:B]hs?'~sB}

Funciona no transpiler Java antigo. Espera as duas seqüências em uma lista como entrada, unifica a saída com a substring. Se nenhuma substring for encontrada, retornará false.

Infelizmente ainda não codifiquei o subconjunto embutido no novo transpilador Prolog.

Explicação

:1f               Find all bindings which satisfy predicate 1 with that binding as input and
                  with the Input of the main predicate as output.
   oh.,           Order that list of bindings, and unify the output with the first one.

{
 ,.[A:B]          Unify the output with the list [A,B]
        hs?       Unify the input with a subset of A
           '~sB   Check that no subset of B can be unified with the input
               }

4

Python, 119 115 91

lambda a,b:[a[m:m+n]for n in range(1,len(a)+1)for m in range(len(a))if a[m:m+n]not in b][0]

Casos de teste:

| Input 1  | Input 2     | Output        |
|----------+-------------+---------------|
| 'abcd'   | 'abc'       |  'd'          |
| 'abcd'   | 'dabc'      |  'cd'         |
| 'abcd'   | 'dcbabbccd' |  'abc'        |
| 'abcdf'  | 'abcdebcdf' |  'abcdf'      |
| 'abc'    | 'abc'       |  (IndexError) |

Trabalhando em torná-lo mais curto, mas este é o meu instinto cerebral. Ainda não é realmente um jogador de golfe.

Obrigado a @ user81655 e @NonlinearFruit pelos bytes extras.

Editar :

Dang. Tentei este código:

def z(a,b):
 for s in [a[m:m+n]for n in range(1,len(a)+1)for m in range(len(a)-n+1)]:
  if s not in b:return s
 return''

Pensei que fosse alguns bytes mais curto. Acontece que era 1 byte a mais do que eu tinha antes da edição.


Eu não sei muito python, mas talvez você possa fazer, (r=range)(1,len(a)+1)então usar r?
Conor O'Brien

@ CᴏɴᴏʀO'Bʀɪᴇɴ Não é possível fazer isso dessa maneira. Se eu atribuir rangea rna linha acima, ele realmente adiciona um byte. Boa ideia, no entanto. Provavelmente existe uma maneira mais curta de percorrer as substrings.
Taylor Lopez

range(1,len(a))e range(len(a)-1)deve funcionar, não deveria? Também acho que o uso de um caractere de tabulação para o recuo de dois espaços salvaria um byte.
user81655

Não, com range(1,len(a)), o quarto teste de teste falha porque não tenta a sequência completa; ele irá apenas para o comprimento da string - 1. E com range(len(a)-1), o primeiro caso de teste falha ao retornar em 'cd'vez de apenas 'd'. Pode haver algo lá, no entanto.
Taylor Lopez

Desculpe, eu não estou familiarizado com Python e assumi que os intervalos eram inclusivos. Nesse caso, tente range(1,len(a)+1)e range(len(a)).
user81655

3

Python, 87 86 bytes

lambda s,t,e=enumerate:[s[i:i-~j]for j,_ in e(s)for i,_ in e(s)if(s[i:i-~j]in t)<1][0]

Se existir, retornará o mais à esquerda de todas as substrings únicas mais curtas.

Se não houver substring exclusivo, um IndexError será gerado.

Teste em Ideone .


Aí está. Eu estava esperando alguém matar minha implementação não lambda. bom lol
Taylor Lopez

Eu acho que você pode fazer este mais curto, fornecendo o segundo argumento opcional para enumeratecomeçar ja i+1.
user2357112 suporta Monica

@ user2357112 Isso gera um NameError , infelizmente. O código define jprimeiro, então i.
Dennis

@ Dennis: Sim, mas não precisa. Você pode mudar a ordem do loop.
user2357112 suporta Monica

1
@ user2357112 Se mudar a ordem dos laços, a primeira subcadeia única que encontrar poderá não ser a mais curta. Basta trocar as devoluções de pedidos 'ab'por entradas 'abc','aaa'.
Dennis

2

Python, 82 bytes

g=lambda u:{u}|g(u[1:])|g(u[:-1])if u else{''}
f=lambda s,t:min(g(s)-g(t),key=len)

Uso: f('A&&C', 'A&$C') -> retornos'&&'

Gera ValueError se não houver substring adequado.

Explicação:

g=lambda u:{u}|g(u[1:])|g(u[:-1])if u else{''}cria recursivamente um conjunto de substrings de u f=lambda s,t:min(g(s)-g(t),key=len)leva o menor substring da diferença de conjunto


2

JavaScript (ES6), 79 bytes

f=
(a,b)=>[...a].some((_,i,c)=>c.some((_,j)=>b.indexOf(s=a.substr(j,i+1))<0))?s:''
<div oninput=o.textContent=f(a.value,b.value)><input id="a"/><input id="b"/><pre id=o>

Se o retorno falsefor aceitável, salve 2 bytes usando em &&svez de ?s:''.



1

JavaScript (Firefox), 80 bytes

solution=

a=>b=>[for(_ of(i=0,a))for(_ of(j=!++i,a))if(b.includes(s=a.substr(j++,i)))s][0]

document.write("<pre>"+
[ [ "test", "best" ], [ "wes", "west" ], [ "red", "dress" ] ]
.map(c=>c+": "+solution(c[0])(c[1])).join`\n`)

O teste funciona apenas no Firefox. Retorna undefinedse não houver substring.


As strings podem conter caracteres ASCII imprimíveis, como \ ou outros metacaracteres RegExp, mas se você está se limitando ao Firefox, por que não usar b.includes?
295 Neil

@ Neil A pergunta não dizia que as cordas podiam ser de qualquer personagem antes, mas obrigado por me avisar! Atualizado para usar includes.
user81655

1
O trecho de teste lança umSyntaxError: unexpected token 'for'
NoOneIsHere 29/04

@NoOneIsHere Esse é o erro que você vai ter, se você não estiver usando o Firefox ...
user81655

1

Retina , 37 bytes

M!&`\G(.+?)(?!.*¶.*\1)
O$#`.+
$.&
G1`

A saída estará vazia se nenhuma substring válida for encontrada A.

Experimente online! (Levemente modificado para executar vários casos de teste ao mesmo tempo. O formato de entrada é na verdade separado por avanço de linha, mas os conjuntos de testes são mais fáceis de escrever com um caso de teste por linha. A estrutura de teste transforma o espaço em um avanço de linha antes do início do código real.)

Explicação

M!&`\G(.+?)(?!.*¶.*\1)

Para cada posição inicial possível em A, corresponda à substring mais curta que não aparece B. O &é para correspondências sobrepostas, de modo que tentamos todas as posições iniciais, mesmo que uma correspondência tenha mais de um caractere. Os \Ggarante que não pular nenhuma posições - em particular, desta forma, temos de parada no avanço de linha, de modo que nós não temos partidas adicionais a partir , por isso, vai todos os substrings que começam mais para a direita da posição atual, de modo descartando isso não é um problema (e realmente melhora o desempenho).B si. A razão pela qual isso não atrapalha as coisas é realmente bastante sutil: porque se houver uma posição inicial em Aque não possamos encontrar nenhuma substring válida, também será uma falha que fará com \Gque pare de verificar outras posições. No entanto, se (a partir da posição inicial atual) todas as substrings apareceremB

Devido à M!configuração, todas essas correspondências serão retornadas do estágio, unidas aos feeds de linha.

O$#`.+
$.&

Isso classifica as linhas do resultado anterior por comprimento. Isso é feito combinando a linha com .+. Em seguida, $ativa uma forma de "ordenar por", de modo que a correspondência seja substituída por $.&para determinar a ordem de classificação. O $.&próprio substitui a partida pelo seu comprimento. Finalmente, a #opção informa ao Retina para classificar numericamente (caso contrário, trataria os números resultantes como seqüências de caracteres e os classificaria lexicograficamente).

G1`

Finalmente, mantemos apenas a primeira linha, usando um estágio grep com um regex vazio (que sempre corresponde) e um limite de 1.


1

Perl, 87 85

sub{(grep{$_[1]!~/\Q$_/}map{$}=$_;map{substr($_[0],$_,$})}@}}(@}=0..length$_[0]))[0]}

Essa é uma função anônima que retorna o primeiro (por posição) dos substrings mais curtos $_[0]que não ocorrem $_[1]ou undefse não existe nenhum substring.

Programa de teste com seqüências de caracteres retiradas da resposta de @ iAmMortos, testadas com Perl 5.22.1:

#!/usr/bin/perl -l
use strict;
use warnings;

my $f = <see above>;
print $f->('abcd', 'abc');
print $f->('abcd', 'dabc');
print $f->('abcd', 'dcbabbccd');
print $f->('abcdf', 'abcdebcdf');
print $f->('abc', 'abc');

1

Haskell, 72 bytes

import Data.Lists
a#b=argmin length[x|x<-powerslice a,not$isInfixOf x b]

Exemplo de uso: "abcd" # "dabc"-> "cd".

Uma implementação direta: construa todas as subseqüências ae mantenha as que não aparecem b. argminretorna um elemento de uma lista que minimiza a função dada a 2ª argumento, aqui: length.


Eu não sabia argmin! Parece extremamente útil.
Zgarb

0

Pitão - 9 6 bytes

h-Fm.:

Experimente online aqui .


Riscado 9 ainda é 9
cat

Eu adoraria saber como isso funciona.
23418 mroman

@mroman o.: com um argumento são todos os substrs. Então, mapeio isso sobre as duas strings, depois dobra o diff setwise, para que eu tenha todos os substrs do primeiro que não são do segundo, depois escolho o primeiro, que é o menor, porque é classificado.
Maltysen 25/11/19

0

C #, 152 bytes

string f(string a,string b){int x=a.Length;for(int i=1;i<=x;i++)for(int j=0;j<=x-i;j++){var y=a.Substring(j,i);if(!b.Contains(y))return y;}return null;}

0

Ruby, 70 bytes

Coleta todas as substrings de um determinado comprimento da primeira string e, se houver uma que não esteja na segunda, retorne-a.

->a,b{r=p;(1..l=a.size).map{|i|(0...l).map{|j|b[s=a[j,i]]?0:r||=s}};r}

0

Burlesco - 26 bytes

No momento, a maneira mais rápida de obter é:

lnp^sujbcjz[{^p~[n!}f[-][~

0

Japonês , 14 bytes

Êõ!ãU c k!èV g

Experimente online!

Retorna undefinedse não houver substring válido . Isso é diferente de retornar a sequência "indefinida" , embora a diferença seja visível apenas devido ao sinalizador -Q.

Explicação:

Ê                 :Length of the first input
 õ                :For each number in the range [1...length]:
  !ãU             : Get the substrings of the first input with that length
      c           :Flatten to a single array with shorter substrings first
        k         :Remove ones which return non-zero to:
         !èV      : Number of times that substring appears in second input
             g    :Return the shortest remaining substring

0

Japonês -h, 11 bytes

à f@øX «VøX

Tente

                :Implicit input of strings U & V
à               :All combinations of U
  f@            :Filter each as X
    øX          :  Does U contain X?
       «        :  Logical AND with the negation of
        VøX     :  Does V contain X?
                :Implicit output of last element
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.